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本 书 在 扼要 回顾 蛋白 质 结构 研究 中 的 重要 历史 事件 及 概述 蛋白 
质 结构 基础 理论 基础 上 ， 阐 述 蛋白 质 结构 预测 、 蛋 白质 结构 模拟 、 
锌 指 核酸 酶 的 构建 、 诱 导 多 能 干细胞 的 关键 转录 因子 Oct4 结 构 模 拟 
与 设计 、 蛋 白质 (BS) 进化 工程 等 内 容 。 书 中 部 分 素材 来 源 于 作者 自 
身 研 究 成 果 和 经 验 ， 内 容 较 新 。 

作者 撰写 本 书 的 目的 之 一 在 于 引导 从 事 蛋 白质 结构 研究 的 科技 
工作 者 在 解决 具体 问题 借鉴 前 辈 科学 大 师 的 有 效 逻 辑 、 方 法 及 强 有 
力 的 意志 。 
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5.1 序列 H5N1-NA ( Accession No. Q5H89 ) 和 N9-NA ( Accession No. Q84070 ) 比 对 
图 中 氨基 酸 颜色 表示 氨基 酸 的 功能 : 酸性 一 红色 ; 碱 性 一 蓝 色 ; 中 性 亲 水 一 粉红 色 ; 脂肪 族 一 墨绿 色 ; 芳香 
族 一 青绿 色 ; 包含 琉 基 一 黄色 ; 亚 胺 基 一 橙色 


5.2 ”根据 结合 DANA 的 N9-NA 复合 物 
晶体 结构 ( 红色 ) 构建 的 H5N1-NA 的 三 维 
结构 (绿色 ) 
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5.4 配 体 DANA (红色 ) 分 别 与 受 体 N9-NA (a) 和 H5N1-NA (b) 
活性 位 点 残 基 ( 蓝 色 ) 相互 作用 示意 图 


5.5 N9-NA (a) #1 
H5N1-NA (b) 活性 空 腔 


的 亲 脂 和 亲 水 表面 示意 图 
其 中 绿色 表示 亲 脂 性 ， 蓝 色 
表示 亲 水 性 
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图 5.7 ”模拟 过 程 中 骨架 碳 原子 的 均 方 根 偏 图 5.8 ”骨架 碳 原子 的 回转 半径 示意 图 
差 随 时 间 变 化 示意 图 
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5.9 ”模拟 过 程 中 螺旋 6 与 螺旋 9 之 间 的 距离 


图 5.10 MD 模拟 中 T1 脂肪 酶 . 
TH (a) 与 关闭 (b) 的 构象 25.12 T1 脂肪 酶 结构 变化 的 分 子 机 理 示意 图 
红色 代表 螺旋 9， 蓝 色 代 表 螺 旋 6， 绿 色 红色 代表 疏水 ， 蓝 色 代 表亲 水 
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图 5.14 ”模拟 过 程 中 体系 总 能 量 和 骨架 碳 原子 的 均 方 根 偏差 随时 间 变 化 示意 图 
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5.16 ”A30P 突 变 所 带 来 的 结构 变化 示 和 
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图 中 野生 型 结构 用 蓝 色 棍 状 模型 表示 ， 而 突变 型 结构 则 是 用 红色 棍 状 模型 表示 
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5.19 各 体系 蛋白 酶 骨架 原子 的 RMSD 随时 间 变 化 规律 
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5.20 ”各 体系 中 骨架 碳 原子 在 分 子 动力 学 模拟 5.22 Bmut BARS (红色 ) 与 Ви 
中 的 振动 情况 (黄色 ) 蛋白 酶 的 空间 结构 释 合 


5.24 Fut (绿色 ) 和 Bwt( 黄 色 ) 蛋白 酶 B 链 (a) 和 S1/S1 KOR (b) 的 空间 结构 丢 合 
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5.26 Ати ( 蓝 色 ) 和 Bwt (黄色 ) 蛋 白 酶 图 6.18 各 种 密码 子 在 大 肠 杆 菌 中 的 使 用 频率 
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6.26 Deep View 软件 工作 界面 


8.2 ЖА POP 家 族 apAPH (青色 ) 和 来 自 HSL 家 族 的 
AFEST (灰色 ) 催化 结构 域 和 催化 三 联 体 的 结构 重合 
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生命 科学 在 21 世纪 已 从 基因 组 的 研究 进入 功能 基因 组 或 结构 基因 组 的 研究 ， 
也 就 是 说 要 在 蛋白 质 结构 的 基础 上 研究 基因 编码 的 各 种 蛋白 质 的 功能 ， 并 从 传统 
的 单个 蛋白 质 的 研究 走向 细胞 内 蛋白 质 群体 的 研究 ， 从 而 更 加 深入 地 揭示 生命 活 
动 的 奥秘 。 这 方面 的 工作 构成 了 当今 生命 科学 研究 的 前 沿 ， 即 蛋白 质 科 学 。 

人 类 对 蛋白 质 重要 性 的 认识 源远流长 1878 年 恩格斯 在 《 反 杜 林 论 》 中 就 指 
出 “生命 是 蛋白 体 的 存在 形式 ”。 不 过 当时 对 蛋白 质 的 本 质 和 结构 还 知之 甚 少 。 
不 入， 瑞典 的 Theodor Svedberg 利用 他 首创 的 超 离 心 技 术 才 知道 蛋白 质 分 子 是 均 
一 的 并 具有 固定 的 分 子 量 。 此 后 ， 剑 桥 大 学 的 Frederick Sanger 利用 纸 电泳 和 纸 
层 析 测 出 了 第 一 个 蛋白 质 一 一 胰岛 素 的 一 级 结构 ;Max Perutz 和 John Kendrew 
利用 他 们 首创 的 重 原子 同 晶 置换 技术 测 出 了 第 一 个 蛋白 质 一 一 肌 红 蛋白 晶体 的 三 
维 结构 。 我 国 对 蛋白 质 的 研究 起 步 也 不 晚 。20 世纪 二 三 十 年 代 ， 北 京 协 和 医学 院 
吴 宪 领导 的 实验 室 对 蛋白 质 的 变性 作用 进行 了 深入 系统 的 研究 ， 提 出 蛋白 质变 性 
的 实质 是 蛋白 质 分 子 从 紧密 而 有 序 的 结构 变 为 散漫 而 无 序 的 结构 。 吴 宪 的 蛋白 质 
变性 学 说 对 当前 蛋白 质 分 子 折 又 的 研究 仍然 具有 现实 意义 。 及 至 20 世纪 五 六 十 
年 代 ， 中 国 科学 院 生 物化 学 研究 所 、 有 机 化 学 研究 所 和 北京 大 学 又 通过 社会 主义 
大 协作 合成 了 胰岛 素 ， 而 且 得 到 了 晶体 。 这 不 仅 是 世界 上 第 一 次 在 实验 室 合成 了 
具有 天 然 构象 的 蛋白 质 ， 而 且 彻底 证 明了 “一 级 结构 决定 高 级 结构 ”这 一 重要 原 
理 。 随 后 ， 我 国 又 独立 测 出 了 胰岛 素 晶体 的 三 维 结构 。 正 是 由 于 国内 外 这 些 开 创 
性 的 工作 ， 才 有 了 当前 蛋白 质 科学 的 茵 勃发 展 。 

回顾 蛋白 质 科 学 发 展 的 历程 ， 我 们 可 以 看 到 先进 技术 对 科学 发 展 的 无 比重 要 
性 。 除 了 上 述 的 超 离心 、 色 谱 、 电 泳 、 重 原子 同 晶 置换 等 技术 以 外 ， 后 来 涌现 的 
高 压 液 相 层 析 、 二 维 凝 胶 电泳 、 毛 细 管 电泳 、 质 谱 、 生 物 芯 片 等 技术 又 引领 了 蛋 
白质 组 学 的 研究 ， 使 我 们 有 可 能 对 细胞 内 的 大 量 蛋白 质 群体 进行 综合 研究 。 由 此 
看 来 ， 科 学 与 技术 是 相辅相成 的 ， 相 互 促进 的 ， 二 者 缺 一 不 可 。 

在 人 类 基因 组 已 被 基本 破译 的 基础 上 ， 成 千 上 万 的 蛋白 质 的 结构 与 功能 及 其 
相互 作用 或 待 阐明 。 蛋 白质 科学 的 研究 成 果 将 有 助 于 阑 明生 命 现 象 的 本 质 和 活动 
规律 ， 为 多 种 疾病 的 致 病 机 理 和 防治 提供 理论 依据 。 因 此 ， 蛋 白质 科 学 是 发 达 
家 激烈 争夺 的 制高点 ， 成 为 近年 来 生命 科学 不 断 取 得 重大 突破 的 热点 领域 。 我 国 


对 蛋白 质 科 学 也 给 予 了 高 度 重视 ， 《国家 中 长 期 科学 和 技术 发 展 规划 纲要 
(2006—2020 年 )》 将 “蛋白 质 研究 ” 列 为 四 项 重大 科学 研究 计划 之 一 。 在 广大 科 
研 人 员 的 共同 努力 下 ， 我 国 在 蛋白 质 研究 领域 已 开始 出 现 与 国际 先进 水 平 基本 同 
步 的 良好 发 展 态势 ， 取 得 了 一 些 重要 的 理论 和 应 用 成 果 ， 陆 续 在 “Nature”、 
“Science”、“Cell” 等 重要 期 刊 上 发 表 了 一 批 有 影响 的 论文 。 

正 是 在 这 样 的 背景 下 ， 化 学 工业 出 版 社 及 时 出 版 的 这 套 《 蛋 白质 科学 与 技术 
从 书 》 很 有 现实 意义 。 从 书 由 相互 独立 而 又 彼此 联系 的 各 分 册 组 成 ， 主 题 包括 
“理论 ”和 “技术 ”两 个 层面 ， 现 阶段 以 “技术 ”为 主 。 归 纳 起 来 ， 这 套 丛 书 具 
有 以 下 一 些 特色 。 

1. 选 题 涉 及 的 范围 较为 广泛 。 从 蛋白 质 的 基础 理论 ， 到 研究 的 各 种 技术 方 
法 ， 以 至 于 前 沿 的 蛋白 质 组 研究 ， 在 丛书 中 都 有 体现 ， 以 满足 不 同方 向 、 不 同 层 
次 的 科研 和 教学 需要 。 

2. 编写 队伍 具有 较 高 水 准 ， 由 中 国 科学 院 、 军 事 医学 科学 院 、 北 京 大 学 、 南 
京 大 学 等 单位 活跃 在 第 一 线 的 学 术 骨 干 为 主编 写 。 

3. 编写 人 员 分 布 在 国内 外 各 研究 机 构 ， 因 而 能 扬 各 家 之 长 ， 并 体现 国际 化 的 
学 术 合 作 。 

值得 欣慰 的 是 ， 目 前 这 套 从 书 已 通过 立项 成 为 “十 一 五 ”国家 重点 图 书 出 版 
项 目 ， 其 编写 计划 也 得 到 了 学 术 界 的 大 力 支持 ， 进 展 顺利 。 计 划 两 年 内 陆续 出 版 
的 第 一 批 书目 包括 : 


蛋白 质 物理 学 概论 蛋白 质 组 学 原理 

蛋白 质 电 泳 技术 指南 蛋白 质 色谱 分 离 技 术 
蛋白 质 质谱 技术 蛋白 质 微 阵列 

蛋白 质 高 效 表 达 技 术 蛋白 质 结构 模拟 与 设计 


蛋白 质 科学 的 研究 方兴未艾 ， 今 后 的 发 展 任 重 而 道 远 。 面 对 这 一 挑战 ，《 蛋 
白质 科学 与 技术 丛书 》 的 出 版 必 将 促进 我 国 的 蛋白 质 科 学 在 已 有 的 基础 上 进一步 
发 扬 光 大 。 同 时 ， 随 着 这 一 领域 的 飞速 发 展 ， 也 希望 这 套 丛书 能 不 断 推出 后 续 的 
新 篇 和 新 人 新 作 。 


中 国 科 学 院 院士 
张 友 尚 
2007 年 4 月 26 日 
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蛋白 质 结构 是 生物 科学 的 一 个 重要 部 分 ， 与 人 类 自身 的 重要 哲学 命题 “生命 
是 什么 ”密切 相关 。 回 顾 这 个 研究 领域 的 科学 问题 、 研 究 方法 、 相 应 的 理论 和 概 
念 的 发 展 以 及 相互 促进 的 关系 ， 能够 启发 对 科学 研究 充满 兴趣 的 青年 及 早 考虑 诸 
如 此 类 的 重要 事项 : 什么 是 科学 问题 ? 科学 问题 是 从 哪里 来 的 ? 重大 科学 发 现 的 
逻辑 和 巧妙 是 什么 ?科学 问题 的 解决 首先 需要 大 胆 的 假设 和 推断 ， 再 借鉴 和 发 展 
新 方法 和 新 工具 , 小 心 求证 理论 假设 。 

蛋白 质 结 构 研 究 的 很 多 突破 性 发 展 都 是 从 物理 学 领域 借用 研究 方法 和 工具 ， 
An X 射线 衍射 、 核 磁 共 振 (NMR)、 同 步 辐 射 。 因 此 , 科学 工作 者 不 仅 需要 与 同行 
交流 , 也 要 时 时 关注 相关 科学 领域 的 进展 情况 , 有 哪些 理论 、 方 法 可 以 “借用 ”? 
有 哪些 启示 可 以 收集 ? 青年 科学 工作 者 心理 要 有 所 准备 ， 在 重大 创新 的 实践 活动 
H, 不 乏 “ 十 年 磨 一 全 ”的 例子 。 在 磨 剑 过 程 中 潜心 提高 自己 科学 问题 凝练 能 力 ， 
设计 解决 问题 的 有 效 方法 , 积累 重要 的 科学 数据 作为 攀登 的 “台阶 ”和 “扶手 ”。 
此 外 ,还 要 对 自己 的 发 现 不 能 马上 被 “大 师 ” 们 承认 的 风险 有 所 准备 。 原始 创 新 
有 时 是 孤独 的 ， 因 此 是 勇敢 者 的 游戏 。 

蛋白 质 结构 研究 中 充满 着 大 量 的 数学 问题 ， 请 不 要 被 其 吓 回 头 ! 阅读 本 书 重 
在 设想 自己 处 在 科学 家 们 “无 助 ”的 位 置 时 ， 会 如 何 思考 遇 到 的 问题 ,能够 有 解 
决 问题 的 不 同 逻 辑 吗 ? 请 读者 与 我 一 起 来 参加 到 科学 家 们 的 游戏 中 , 体验 一 下 他 
们 的 甘苦 ， 重 温 发 现 的 快乐 与 激动 , 也 体验 一 下 找 不 到 解决 问题 出 路 时 “无 助 ”的 
挫折 感 ， 以 及 重大 发 现 未 被 承认 时 的 孤独 感 。 你 ， 只 有 及 早 体验 这 些 感受 ,才能 
及 早 进 入 创新 的 角色 中 。 

本 书 在 介绍 科学 与 技术 内 容 的 同时 ， 也 尽 所 能 提供 一 些 对 蛋白 质 结构 研究 科 
学 思想 发 展 的 节点 和 重要 手段 作出 重要 贡献 的 科学 家 的 简短 介绍 。 近 不 惑 之 年 才 
刚刚 悟 出 这 样 的 道理 : 蛋白 质 结构 研究 手段 及 其 科学 思想 发 展 都 是 本 领域 的 科学 
家 接力 完成 的 。 只 有 具备 了 某 些 必要 的 素质 、 品 质 和 思维 能 力 ， 才 能 接 过 前 人 思 
想 的 接力 棒 ， 进 一 步 设计 新 的 探索 方向 ， 提 出 科学 假说 ， 设 计 新 的 实验 方法 ， 建 
立新 层次 的 科学 思想 和 创新 理论 ， 才 能 将 科学 事业 推 到 更 高 的 境界 。 为 什么 只 有 
少数 人 能 够 成 为 杰出 科学 家 ， 为 什么 这 些 人 才能 够 传承 顶级 的 科学 思想 ? 正如 
“钱学森 之 问 ”: 为 什么 我 们 的 学 校 总 是 培养 不 出 杰出 人 才 ? BARIERA 
胱 的 感觉 ， 核 心 应 该 是 “人 ”。 


最 后 , 建议 读者 在 了 解 科技 内 容 的 同时 ， 更 要 提醒 自己 :“ 需 要 培养 什么 样 的 
思想 、 素 质 和 能 力 才能 创造 新 的 科学 知识 ?” 创 新 的 主体 是 “人 ”， 读 者 每 读 过 一 
章 ， 可 以 挑 一 个 自己 有 亲近 感 的 科学 家 和 具体 问题 ， 用 互联 网 提供 的 便利 工具 ， 
找 出 自己 的 “科学 家 ”解决 科学 问题 的 每 一 个 台阶 和 扶手 的 原始 科学 文献 ， 看 能 
否 拼 出 其 走 过 路 线 上 的 路 标 ， 其 判断 前 进 方向 的 逻辑 和 其 中 的 精妙 。 也 请 读者 以 
本 书 科学 家 小 传 内 容 为 跳板 ， 查 阅 更 多 关于 杰出 先辈 们 思想 和 行为 的 文献 ， 找 出 
自己 需要 培养 什么 思想 品格 ,需要 积累 什么 经 验 ， 进 行 什么 练习 ? 认识 到 了 这 
36, FER SAAT, ЖЕ Нк, MAA IAAL AY fal iB а fa] E 

本 书 成 稿 仓促 ， 错 误 难 免 ， 欢 迎 批评 指正 。 


李 荣 秀 
2011 年 3 月 
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1.1 生命 是 什么 


20 世纪 是 生命 科学 大 发 展 的 时 期 。 奥 地 利 物 理学 家 薛 定 谓 是 波动 力学 
之 父 ， 是 量子 力学 集大成 者 之 一 。 正 是 他 从 物理 学 领域 闻 和 人 生物 学 领域 ， 在 
1944 年 出 版 了 《生命 是 什么 一 一 活 细胞 的 物理 学 观 》 一 书 。 在 书 中 薛 定 刘 
提出 了 一 系列 大 胆 的 猜想 ,生命 现象 用 物理 学 和 化 学 理论 进行 诠释 ; 基因 类 
似 非 周 期 性 的 晶体 或 固体 ， 突 变 是 基因 分 子 中 的 “量子 跃迁 ”引起 的 ;染色 
体 是 遗传 的 密码 本 ; 生命 是 “ 负 焙 ”驱动 的 ,需要 从 环境 抽取 “ 序 ” 维 持 生 
命 系统 的 有 序 组 织 …… 这 些 十 分 新 奇 的 观点 特别 引人入胜 。 

苹 定 记 这 部 书 出 版 以 后 ， 一 批 物 理学 家 投身 到 生物 学 和 遗传 学 的 研究 洪 
流 中 ， 新 西 兰 物理 学 家 威 尔 金 斯 (1945 年 转向 ) 和 英国 物理 学 家 克 里 克 
(1947 年 或 1949 年 转向 ) 就 是 其 中 两 位 。 正 是 《生命 是 什么 》 这 部 书 ， 使 
克 里 克 放弃 了 粒子 物理 的 研究 计划 ， 钟 情 于 从 未 打算 涉猎 的 生物 学 ;也 使 威 
尔 金 斯 告别 了 物理 学 ， 热 衷 于 探究 生命 大 分 子 复杂 结构 的 奥妙 。 此 外 ， 美 国 
生物 学 家 沃 森 在 芝加哥 读 大 学 时 ， 就 被 牢 牢 地 吸引 住 了 ， 以 此 为 契机 ， 他 立 
志 献 身 于 揭 开 生命 遗传 的 奥秘 。 此 外 ， 卢 利 亚 、 查 尔 加 夫 、 本 泽 等 一 一 也 都 
受到 这 部 书 的 感染 。 


1.2 生物 体 的 有 序 结构 


经 过 漫长 的 岁月 ， 地 球 上 的 生命 从 肉眼 看 不 见 的 单 细胞 生物 进化 成 今天 
的 藻类 、 菌 类 、 植 物 、 动 物 和 人 类 。 其 共同 的 特征 包括 : 生物 体 和 周围 环境 
不 断 进行 着 物质 交换 和 能 量 流动 的 新 陈 代谢 活动 ， 通 过 调整 自身 与 环境 的 关 
系 ， 调 节 自身 内 部 的 各 种 机 能 ， 从 而 维持 生物 体 在 特定 空间 和 特定 时 段 的 稳 
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ERS: 许多 生物 调节 系统 都 比较 复杂 ， 往 往 兼 有 正 向 与 反 向 调节 作用 。 从 
层次 角度 看 ， 调 节 可 以 在 分 子 水 平 、 细 胞 水 平 、 组 织 器 官 水 平 以 及 整体 水 平 
进行 。 从 调节 方式 看 ， 存 在 着 诱导 、 阻 遏 后 反馈 抑制 。 生 物体 的 一 个 重要 特 
征 是 自我 复制 和 生长 发 育 。 生 物体 的 自我 复制 表现 在 分 子 层面 、 细 胞 层面 和 
MART: 脱氧 核糖 核酸 (deoxyribonucleic acid， 简 称 DNA) 从 一 条 链 复 
制 成 两 条 链 ， 一 个 细胞 分 裂 成 两 个 细胞 ， 以 及 生物 体 的 繁殖 形成 更 多 的 相似 
个 体 。 一 只 蚊子 能 够 在 空中 飞舞 ， 在 我 们 皮肤 上 能 够 吸血 。 如 果 我 们 一 掌 拍 
下 去 打 个 正 着 ， 那 么 它 就 再 不 能 继续 吸血 ， 也 不 能 飞 走 了 。 因 此 生物 体 另 一 
个 重要 特征 就 是 严整 有 序 的 结构 。 生 物体 的 各 种 组 成 部 分 不 是 随机 混合 在 一 
起 的 ， 而 是 非常 精妙 有 序 的 严整 的 组 装 。 生 物 是 多 层次 的 有 序 结构 。 细 胞 、 
组 织 、 器 官 、 系 统 和 个 体 ， 每 一 个 层次 中 的 各 个 结构 单元 ， 都 有 它们 各 自 特 
定 的 结构 和 功能 ， 它 们 的 协调 活动 构成 了 复杂 的 生命 系统 。 


1.3 生物 体 功能 与 结构 层次 


动物 体 的 结构 可 分 为 系统 、 器 官 、 组 织 和 细胞 几 个 层次 。 多 个 器 官 组 成 
的 能 完成 一 系列 连续 性 生理 机 能 的 体系 ， 称 为 系统 。 多 种 组 织 有 序 结合 起 
来 ， 组 成 具有 一 定形 态 并 完成 一 定 生理 功能 的 结构 ， 称 为 器 官 ， 例 如 肺 、 肠 
等 。 组 织 则 是 形态 相似 、 功 能 相同 的 一 群 细胞 和 细胞 间 质 的 组 合 。 动 物体 组 
织 分 为 上 皮 组 织 、 结 缔 组 织 、 神 经 组 织 和 肌肉 组 织 四 种 。 如 运动 系统 由 运动 
控制 器 官 和 运动 器 官 两 部 分 组 成 ;运动 控制 器 官 由 与 运动 感觉 、 运 动 控 制 有 
关 的 纹 状 体 、 小 脑 与 丘脑 腹 前 核 、 腹 外 侧 核 构成 ， 还 包括 大 脑 运动 区 (大 脑 
皮质 4 区 、6 区 )。 运 动 器 官 由 骨骼 和 骨骼 肌 组 成 ， 骨 由 骨 细 胞 ， 胶 原 纤维 
及 骨 基 质 构 成 ， 外 被 以 骨膜 或 软骨 ， 内 有 骨髓 。 每 块 骨 都 是 一 个 器 官 ， 具 有 
一 定形 态 ， 具 有 丰富 的 血管 神经 和 淋巴 管 。 骨 以 其 分 布 部 位 不 同 分 为 躯干 
骨 、 颅 骨 和 四 肢 骨 。 人 骨骼 由 骨 与 骨 相互 连接 成 ， 对 人 体 起 支柱 ， 运动 和 保护 
作用 ; 各 骨 之 间 连 接 构成 骨骼 〈 如 颅 保护 脑 ， 胸 廓 保护 心 、 肺 等 .) 骨骼 肌 
跨 过 一 个 或 多 个 关节 ， 附 着 在 两 块 或 两 块 以 上 的 骨 面 上 ， 在 神经 系统 支配 
下 ， ARIKA, ERAR, ERAZ. 


1.4 蛋白 质 是 生命 活动 的 载体 


1.4.1 蛋白 质 的 功能 


地 球 上 所 有 生命 都 依赖 蛋白 质 的 存在 。 蛋 白质 加 快 人 体 化 学 反应 的 速 
度 ， 蛋 白质 使 我 们 能 够 看 、 听 、 尝 、 闻 、 感 觉 、 体 验 、 思 考 和 行动 。 蛋 白质 


2 于 白质 结构 模拟 与 设计 


是 细胞 生命 活动 的 基础 。 细 胞 中 ， 除 水 分 外 ， 蛋 白质 约 占 细胞 内 物质 的 
80%， 因 此 构成 机 体 组 织 、 器 官 的 成 分 是 蛋白 质 最 重要 的 生理 功能 。 动 物体 
各 种 组 织 细胞 的 蛋白 质 始终 在 不 断 更 新 ， 如 血浆 蛋白 质 的 平均 半衰期 约 为 
10 天 ， 肝 中 大 部 分 蛋白 质 的 半衰期 为 1~8 天 ， 半 衰 期 更 短 的 一 些 蛋 白质 只 
有 数秒 。 成 年 动物 体内 每 天 约 有 3% 的 蛋白 质 更 新 ， 借 此 完成 组 织 的 修复 更 
新 ， 维 持 机 体 健康 与 相对 稳定 。 

蛋白 质 种 类 繁多 ， 进 化 越 高 级 的 生物 体 结构 越 复杂 ， 其 蛋白 质 种 类 和 功 
能 越 繁多 ， 以 功能 不 同 可 以 分 为 以 下 几 类 : 

(1) 结构 蛋白 ”许多 蛋白 质 起 支持 作用 ， 给 生物 结构 以 强度 及 保护 ， 如 
韧带 含 弹性 蛋白 ， 具 有 双向 抗 拉 强度 ， 能 够 提供 机 械 支撑 作用 。 细 胞 骨架 包 
含 蛋白 纤维 的 复杂 网 络 。 在 比较 大 的 尺度 上 ， 肌 肉 的 收缩 依靠 大 的 蛋白 聚集 
体 。 在 其 他 有 机 材料 中 ， 如 头发 和 骨骼 ， 蛋 白质 也 是 重要 的 成 分 。 所 有 多 细 
胞 生物 体 的 所 有 组 织 都 含有 胶原 蛋白 ,， 它 是 消 椎 动物 最 丰富 的 蛋白 ,大约 占 
哺乳 动物 蛋白 总 量 的 1/4。 

(2) 收缩 或 运动 功能 蛋白 ” 某 些 蛋白 质 赋予 细胞 与 器 官 收缩 的 能 力 ， 可 
以 使 其 改变 形状 或 运动 。 如 骨骼 肌 收 缩 靠 肌 动 蛋白 和 肌 球 蛋白 。 

(3) 营养 和 储存 蛋白 ”各 种 离子 、 小 分 子 和 其 他 代谢 物 通 过 与 蛋白 质 结 
合 得 到 储存 ， 如 血红 蛋白 结合 氧 、 转 铁 蛋 白 结合 

(4) 调节 蛋白 合成 蛋白 质 所 必需 的 信息 储存 于 基因 (脱氧 核糖 核酸 的 
序列 ) 中 。 细 胞 活动 的 精密 协调 需要 各 种 基因 产物 〈 蛋 白质 ) 在 正确 的 时 刻 
具有 适当 的 量 ( 浓 度 )。 酶 通过 翻译 DNA 序列 合成 蛋白 质 ， 这 个 生产 过 程 
又 能 被 其 他 蛋白 以 复杂 的 机 制 促进 和 抑制 。 

(5) 运输 蛋白 ”蛋白质 参与 从 电子 到 大 分 子 的 运输 。 铁 由 转 铁 蛋白 运 
输 、 血 红细胞 中 的 血红 蛋白 从 肺 运输 氧 到 其 他 组 织 ， 并 把 二 氧化 碳 运 回 到 
肺 。 蛋 白质 在 膜 上 形成 通道 运输 离子 ， 即 使 蛋白 质 的 跨 膜 运输 也 需要 依赖 其 
他 的 运输 蛋白 。 

(6) 催化 蛋白 ”生物 体系 中 的 化 学 反应 主要 由 酶 (一 种 蛋白 质 ) 来 催 
化 。 从 简单 的 二 氧化 碳水 合 到 生物 大 分 子 的 复杂 转化 ， 都 需要 由 酶 进行 催化 
才能 完成 。 酶 参与 了 从 DNA 读 取 遗 传 信息 到 合成 细胞 中 的 物质 的 一 系列 化 
学 反应 ， 是 细胞 机 器 的 核心 。 它 可 使 反应 速度 加 快 数 百 万 倍 。 

C) 信使 蛋白 ”蛋白质 通过 作为 神经 细胞 间 小 分 子 的 受 体 参与 神经 信号 
的 传递 。 生 物体 内 不 同 器 官 、 组 织 和 细胞 中 的 生物 过 程 必须 得 到 有 效 的 协 
调 。 能 起 协调 作用 的 是 激素 。 部 分 激素 是 蛋白 质 ， 同 时 ， 激 素 受 体 也 是 蛋白 
质 ， 能 起 到 传递 信号 的 作用 。 

(8) 防御 蛋白 ”如 抗体 是 由 免疫 系统 产生 ， 能 够 结合 外 源 颗粒 (如 病毒 
和 细菌 ) 的 蛋白 质 。 
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(9) 其 他 蛋白 ”如 病毒 和 叭 菌 体 是 核 蛋 白 ， 病 毒 可 以 致 病 。 这 些 生物 功 
能 存在 于 生物 体 繁殖 、 生 长 、 结 构 和 死亡 过 程 的 各 个 方面 都 依靠 生物 识别 和 
结合 的 精密 机 制 。 在 分 子 水 平 上 ， 从 基因 的 复制 、 转 录 和 表达 到 基因 的 调 
控 ， 从 生物 催化 剂 一 一 酶 的 活性 到 激素 的 功能 ， 以 及 有 机 体 对 外 源 有 害 物 质 
如 毒素 、 病 毒 、 细 菌 的 抵御 和 清除 过 程 ， 无 不 充满 了 这 种 机 制 。 细 胞 对 接触 
到 的 每 一 种 外 源 物质 进行 辨别 ; 细胞 内 的 几乎 每 一 种 物质 都 首先 被 代谢 它 的 
酶 或 细胞 表面 的 受 体 结合 ， 从 而 吸收 进入 细胞 。 蛋 白质 之 间 可 以 紧密 结合 形 
成 复合 物 ， 蛋 白质 和 核酸 结合 控制 基因 的 复制 与 表达 ， 和 蛋白 质 和 细胞 表面 的 
多 糖 结合 ， 蛋 白质 和 脂 类 结合 整合 到 细胞 膜 上 。 这 些 生物 功能 的 物质 基础 是 
蛋白 质 结构 。 


2 蛋白 质 结构 


蛋白 质 是 具有 特定 长 度 的 线性 非 均一 聚合 物 ， 如 某 种 蛋白 质 包含 的 单 体 
的 种 类 和 组 成 是 恒定 的 ， 而 不 同 蛋 白质 则 包含 不 同 种 类 和 数量 的 单 体 ， 从 几 
个 到 几 千 个 不 等 。 线 性 链 再 折合 成 为 三 维 构象 。 蛋 白质 构象 的 性 质 由 单 体 
(氨基 酸 ) 的 序列 决定 ， 因 此 蛋白 质 的 可 能 序列 具有 非常 显著 的 差异 ， 相 应 
地 ， 和 蛋白 质 的 三 级 结构 也 具有 极 大 的 多 样 性 ， 从 纤维 状 到 球状 。 蛋 白质 的 结 
构 一 般 分 为 几 个 层次 : 


1. 


> 


(1) 一 级 结构 “构成 蛋白 质 的 单元 氨基 酸 通 
过 肽 键 连接 形成 的 线性 序列 ， 为 多 肽 链 。 

(2) 二 级 结构 一 级 结构 中 部 分 肽 链 的 弯曲 
或 折 释 产生 二 级 结构 。 多 肽 链 的 某 些 部 分 氨基 酸 
残 基 周 期 性 空间 排列 。 卷 曲 所 形成 的 二 级 结构 称 
为 a- 螺 旋 ， 折 释 所 形成 的 二 级 结构 称 为 折 难 片 。 
这 两 种 二 级 结构 的 形成 都 是 由 于 距离 一 定 的 
一 N 一 H 基 团 和 一 C —O 基 团 之 间 形 成 氢 键 。 

(3) 三 级 结构 ”在 二 级 结构 基础 上 进一步 折 
全 成 紧密 的 三 维 形式 。 三 维 结构 一 般 都 是 球状 或 
纤维 状 的 。 

(D 四 级 结构 ”由 蛋白 质 亚 基 结 构 形成 的 多 
于 一 条 多 肽 链 的 蛋白 质 分 子 的 空间 排列 。 

恩 内 斯 特 ， 卢 瑟 福 (Lord Ernest Rutherford) (图 1. 1) ， 现 代 原子 科学 
的 莫 基 人 ， 原 子 之 父 。 生 于 新 西 兰 Nelson 附近 的 泉 林村 ， 父 亲 是 农民 ， 母 
亲 是 乡村 教师 。1895 年 考取 大 英 博 览 会 奖学金 ， 到 英国 剑桥 大 学 卡 文 迪 什 
实验 室 学 习 。1911 年 由 a 粒子 散射 实验 推出 卢 瑟 福原 子 模型 ， 指 出 原子 有 
一 个 极 小 的 核 ， 几 乎 集中 了 原子 的 全 部 质量 ， 而 电子 则 绕 核 旋 转 ， 而 非 之 前 


图 1.1 BASE: ЖЇН 


和。 蛋白 质 结构 模拟 与 设计 


人 们 认为 的 “葡萄 干 布丁 ”模型 (电子 “镶嵌 ”在 原子 上 ， 就 像 布 上 的 葡 
aT. 

卢 瑟 福 是 20 世纪 初 最 伟大 的 实验 物理 学 家 ，1908 年 诺 贝 尔 化 学 奖 得 
主 ， 一 生发 表 论文 约 215 篇 ， 著作 6 部 ， 培 养 了 10 位 诺 贝 尔 奖 获得 者 。 卢 
瑟 福 的 实验 室 被 后 人 称 为 “ 诺 贝 尔 奖 得 主 的 幼儿 园 ”。 他 的 头像 出 现在 新 西 
兰 货币 的 最 大 面值 一 100 元 上 面 ， 作 为 国家 对 他 最 崇高 的 敬意 和 纪念 。 

i 小 提示 : 别 忘 了 思考 ! i 
DO 英国 剑桥 大 学 的 卡 文 迪 什 实验 宝 ， 一 直 坚持 这 样 的 规定 ， 每 天 下 午 6 
| 点 整 ， 老 资格 的 研究 人 员 来 到 实验 室 ， 宣 布 时 间 已 到 ， 要 求 每 个 人 停止 工 | 
; 作 。 如 果 谁 不 遵守 ， 他 们 便 引用 Rutherford 的 话 加 以 劝导 。Rutherford | 
; 说 过 :“ 谁 未 能 完成 六 点 前 必须 完成 的 工作 ， 也 就 没有 必要 拖延 下 去 ， 倒 ; 
; 是 希望 各 位 马上 回 家 ， 好 好 想 想 今天 做 的 工作 ， 好 好 思考 明天 要 做 的 工 ; 
; 作 。” 那 是 一 天 深夜 ，Rutherford 撤 着 外 衣 ， 又 来 到 实验 室 检 查 ， 惊奇 地 
| 发 现 有 人 还 在 做 实验 。 由 于 低头， 又 十 分 专心 ， 那 学 生 没 发 现 Rutherford | 
| 站 在 他 的 身后 。Rutherford 轻声 地 问 道 ， “你 上 午 干 什么 ?” 学 生 回头 一 |; 
; 看 ， Ж Rutherford, 他 马上 站 起 来 ， 小 心地 回答 :“ 做 实验 。” Rutherford } 
LRM: “那么 ， 下 午 呢 ?” 学 生 回答 : “MM.” Rutherford 提高 了 声调 ，; 
} 再 间 :“ 晚 上 呢 ?” 学 生 以 为 老师 在 表扬 他 ， 得 意 地 回答 ; “还 是 做 实验 。” | 
Í Rutherford 极为 严肃 地 问 : “你 整 天 做 实验 ， i 
本 学 生 低下 了 类。 上 下， Rutherford 告 诚 他 :“ 别 忘 了 思考 1” 从 此 ， 卡 文 | 
‘ 迪 什 实验 室 的 人 记 住 了 Rutherford 的 忠告 : Pede 1 


1.5 蛋白质 结 构 模 拟 


随 着 人 类 基因 组 、 植 物 基因 组 和 微生物 基因 组 等 大 规模 研究 计划 的 进 
展 ， 基 因数 据 库 每 年 可 增加 数 亿 个 碱 基 序列 ， 数 据 库 的 大 小 每 14 个 月 翻 一 
Æ. UniProtKB/TrEMBL (unreviewed, automatically annotated) Ж Н Ж 
数据 库 2009 年 7 月 7 日 公布 的 40. 5 版 包括 8594382 个 条 目 。 这 些 蛋白 质 序 
列 主要 从 公开 的 基因 和 核酸 序列 数据 库 (如 EMBL-Bank/GenBank/DDBJ 
database) 直接 翻译 编码 序列 而 成 。“UniProtKB/Swiss-Prot” 数 据 库 用 手 
工 标注 ， 加 上 从 文献 收集 的 信息 ， 再 进一步 汇集 成 库 ，2009 年 7 月 7 日 公 
布 的 57. 5 版 包括 470369 FAA. 虽然 X 射线 衍射 技术 和 NMR 技术 近年 
有 了 很 大 发 展 ， 使 越 来 越 多 的 生物 大 分 子 高 级 结构 得 到 了 解决 ， 但 
Brookhaven 蛋白 质 结构 数据 库 (Protein Databank, PDB) 到 2009 年 7 月 
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21 日 也 只 有 59027 个 晶体 结构 。 

随 着 结构 生物 学 的 发 展 ， 越 来 越 多 的 生物 大 分 子 晶体 结构 得 以 发 表 ， 提 
供 了 许多 生物 大 分 子 功能 的 结构 基础 。 生 物体 的 信号 传递 过 程 和 功能 性 相互 
作用 的 机 理 也 越 来 越 清 楚 ， 计 算 机 中 央 处 理 器 ССРО) 速度 更 快 ， 功 能 更 
强 的 分 子 模拟 及 分 子 设计 软件 的 发 展 ， 使 得 在 分 子 水 平 设 计 并 合成 物质 模拟 
生物 大 分 子 成 为 可 能 。 


1.5.1 序列 比 对 


FER LE Xt (sequence alignment) 的 基本 问题 是 比较 两 个 或 两 个 以 上 
DNA 和 和 蛋白质 序 列 的 相似 性 或 差异 性 。 从 生物 学 的 初衷 来 看 ， 这 一 问题 包 
含 了 以 下 几 个 意义 : 从 相互 重 倒 的 序列 片段 中 重 构 DNA 的 完整 序列 ， 将 
各 种 试验 条 件 下 的 探测 数据 (probe data) 构建 为 基因 完整 的 物理 图 谱 ; 
@@ 通 过 序列 比 对 发 现 生物 序列 中 的 功能 、 结 构 和 进化 的 信息 ; 加 生物 学 关系 
密切 的 基因 和 蛋白 质 都 具有 一 些 不 连续 的 共同 序列 ， 序 列 比 对 发 现 的 局 部 序 
列 高 度 相似 比 完整 序列 的 全 局 比 对 更 有 意义 。 序 列 比 对 的 方法 包括 全 局 对 
齐 、 局 部 对 齐 、 空 隙 惩罚 等 ， 序 列 比 对 结果 中 有 匹配 、 不 匹配 、 插 人 和 删除 
以 及 空隙 几 种 区 域 ， 两 个 序列 比 对 常 采用 动态 规划 算法 ， 适 用 于 长 度 较 小 的 
序列 。 而 对 于 海量 基因 序列 (如 人 的 DNA 序列 高 达 109 bp). 就 不 太 适 用 ， 
甚至 采用 复杂 的 非 线性 算法 也 难以 奏效 。 因 此 ， 启 发 式 方法 的 引入 势 在 必 
行 ， 著 名 的 BALST 和 FASTA 算法 及 相应 的 改进 方法 均 是 在 这 种 思想 上 发 
展 起 来 的 。 


1.5.2 蛋白 质 结构 比 对 和 预测 


基本 问题 是 比较 两 个 或 两 个 以 上 和 蛋白质 分 子 空间 结构 的 相似 性 或 不 相似 
性 。 蛋 白质 的 结构 与 功能 是 密切 相关 的 ， 一 般 认 为 ， 具 有 相似 功能 的 蛋白 质 
结构 是 相似 的 。 蛋 白质 是 由 氨基 酸 组 成 的 长 链 ， 长 度 从 50AA 到 1000 一 
3000AA (amino acids) 。 蛋 白质 具有 多 种 功能 ， 如 酶 催化 功能 、 物 质 的 存储 
和 运输 、 信 和 号 传递 、 抗 体 功能 等 。 蛋 白质 的 氨基 酸 序列 决定 了 其 三 级 结构 。 
一 般 认 为 ， 蛋 白质 有 四 级 结构 。 研 究 蛋 白质 结构 和 预测 的 理由 是 : 可 以 理解 
生物 的 功能 ;寻找 dockingdrugs 的 目标 ; 获得 更 好 的 农作物 的 基因 ; 合成 
酶 应 用 于 工业 ; 直接 对 蛋白 质 结构 进行 比 对 的 原因 是 由 于 蛋白 质 的 三 级 结构 
比 其 一 级 结构 在 进化 中 更 保守 ， 同 时 也 包含 了 较 AA 序列 更 多 的 信息 。 蛋 白 
质 三 级 结构 研究 的 前 提 是 假设 内 在 的 氨基 酸 序列 与 三 级 结构 一 一 对 应 〈 不 一 
定 全 真 )， 物 理 上 可 用 最 小 能 量 来 解释 。 从 观察 和 总 结 已 知 结构 的 蛋白 质 结 
构 规律 出 发 来 预测 未 知 蛋白 质 的 结构 ， 同 源 建 模 (homology modeling) 和 
指认 (threading) 方法 属于 这 一 范畴 。 同 源 建 模 用 于 寻找 具有 高 度 相 似 性 
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的 蛋白 质 结构 (超过 30% SER): 后 者 则 用 于 比较 进化 族 中 不 同 的 蛋 
白质 结构 。 然 而 ， 蛋 白质 结构 预测 研究 现状 还 远 远 不 能 满足 实际 需要 。 

(D 药物 “在 一 定 程 度 上 ， 可 以 设计 蛋白 质 ， 如 利用 蛋白 质 工程 改造 胰 
岛 素 ， 使 胰岛 素 更 容易 在 水 中 溶解 成 为 活性 形式 ， 从 而 更 快 地 发 挥 效果 。 了 
解 酶 的 功能 ， 使 人 们 能 够 设计 药物 ， 抑 制 特定 的 目标 酶 的 活性 。 

(2) 农业 “蛋白质 结构 和 功能 的 知识 也 能 够 用 于 治疗 植物 病害 ， 调 节 植 
物 的 生长 和 发 育 ， 如 培育 储存 时 间 更 长 的 水 果 。 

(3) 工业 ”蛋白质 工程 具有 设计 合成 催化 各 种 大 规模 工业 过 程 用 酶 的 潜 
力 。 如 有 科学 家 正在 研究 利用 脂 酶 工业 化 水 解 脂肪 。 
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2.1 假设 + 假设 = 诺 贝 尔 奖 


2.1.1 X 射 线 : 波 还 是 粒子 ? 


德国 慕尼黑 大 学 的 物理 学 家 威 尔 姆 。 康 拉 德 。 伦琴 (Wilhelm Conrad 
Röntgen) 1895 年 发 现 了 X 射线 (又 称 伦琴 射线 ，R6ntgen rays; X 射线 )， 
因此 而 获得 了 1901 年 度 的 诺 贝尔 物理 学 奖 。X 射线 的 发 现 开 创 了 人 类 探索 
物质 世界 的 新 纪元 ， 揭 开 了 20 世纪 物理 学 革命 的 序幕 。X 射线 的 发 现 不 仅 
激 起 公众 对 其 医学 影像 应 用 的 遐想 ， 也 激 起 物理 学 家 们 对 其 本 身 是 什么 的 争 
论 。 当 时 物理 学 正 处 于 革命 性 过 渡 的 中 期 ， 光 是 一 种 波 还 是 一 种 粒子 的 争论 
已 经 持续 了 250 多 年 。 伦 琴 发 现 X 射线 5 年 后 ， 马 克 斯 普 朗 克 〈 马 克 
斯 .卡尔 ， 恩 斯 特 ， 路 德 维 希 。 普 朗 克 ，Max Karl Ernst Ludwig Planck, 
德国 物理 学 家 ， 量 子 力学 的 创始 人 ，20 世纪 最 重要 的 物理 学 家 之 一 ， 因 发 
现 能 量 量子 而 对 物理 学 的 进展 做 出 了 重要 贡献 ， 获 得 1918 年 诺 贝尔 物理 学 
奖 ) 提出 了 量子 理论 ， 认 为 像 物 质 由 原子 组 成 一 样 ， 能 量 是 由 称 为 “量子 ” 
(quanta) 的 粒子 组 成 。1905 年 爱 因 斯 坦 〈 阿 尔 伯 特 。 爱 因 斯 坦 ，Albert 
Einstein， 著 名 的 犹太 裔 理论 物理 学 家 、 思 想 家 及 哲学 家 ， 也 是 相对 论 的 创 
立 者 ， 是 现代 物理 之 父 及 20 世纪 最 重要 的 科学 家 之 一 ) 发 展 了 普 朗 克 的 理 
W, 证 明光 电 效 应 (photoelectric effect) ， 光 照射 到 金属 表面 使 电子 脱出 的 
现象 ， 只 能 用 光 的 粒子 理论 解释 。 尽 管 10 年 后 人 们 最 终 认识 到 光 既 有 波动 
性 又 有 粒子 性 ， 但 当时 并 没有 定论 ， 有 待 于 科学 证 明 。 当 时 ， 伦 琴 已 经 部 分 
证 明了 X 射线 的 波动 性 质 ， 如 在 照相 底片 上 有 效应 ， 但 在 从 一 种 物质 进入 
另 一 种 物质 时 没有 折射 现象 ， 也 不 能 被 反射 。X 射线 不 能 被 强 磁场 折射 ， 因 
此 不 太 可 能 是 带电 粒子 。 但 爱 因 斯 坦 的 观点 仍 存在 极 大 的 影响 , “如 果 X 射 
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线 是 光 ， 那 么 金属 块 怎么 可 能 像 一 个 家 庭 主妇 那样 收集 储存 X 射线 波 的 碎 
片 ， 直 到 自己 的 一 个 儿 辈 电 子 身上 的 能 量 足 够 大 ， 可 以 穿越 真空 产生 XH 
线 ?”1904 E, 英国 利物浦 大 学 的 查尔斯 格 洛 弗 。 巴 克拉 (Charles Bark- 
la, 英国 物理 学 家 。 任 教 于 剑桥 大 学 、 爱 丁 堡 大 学 。 因 发 现 X 射线 的 散射 现 
象 ， 获 得 1917 年 诺 贝尔 物理 学 奖 ) 证 明 X 射线 能 够 被 极 化 。 尽 管 爱 因 斯 坦 
强烈 反对 ,但 极 化 证 据 提示 X 射线 是 横 波 。 进 一 步 的 证 据 表明 ，X 射线 是 
电磁 波 ， 波 长 只 有 可 见 光 波长 的 万 分 之 一 。 阿 诺 德 。 约翰 内 斯 * 威 尔 海 
il * 索 末 菲 (Arnold Johannes Wilhelm Sommerfeld, 德国 物 理学 家 ， 量子 
力学 与 原子 物理 学 的 开山 始祖 之 一 ) 在 1912 年 《物理 学 年 鉴 》( 德 文 An- 
nalen der Physik， 英 文 Annals of Physics) 的 一 篇 论文 中 写 道 , “衍射 证 据 
可 能 是 X 射 线 波动 理论 的 拱 心 石 ”， 关 键 要 看 X 射线 是 否 存 在 衍射 或 干涉 
效应 。 


2.1.2 晶体 结构 之 谜 


19 • 9775 (马克 斯 * YS + 57/5, Мах von Laue， 德 国 物理 学 家 ， 因 发 
现 晶 体 中 X 射线 的 衍射 现象 而 获得 1914 年 诺 贝 尔 物理 学 奖 ) 从 中 学 时 期 就 
喜爱 光学 ， 尤 其 是 光 的 波动 理论 ， 因 此 他 不 假 思 索 就 接受 了 索 末 菲 撰 写 《 数 
学 科学 百科 全 书 》 中 “波动 光学 ”条 目的 提议 ， 这 让 他 有 机 会 思考 晶体 结构 
的 晶 格 理论 。 奥 古 斯 特 " 布 拉 菲 (Auguste Bravais， 法 国 物理 学 家 ) 1850 
年 曾 提 出 晶体 是 由 原子 非常 规则 的 排列 形成 在 三 维 空间 重复 的 几何 形状 ， 即 
点 阵 结构 。 在 晶体 学 家 汉 “' 格 罗 特 (Раш von Groth) 的 支持 下 ， 幕 尼 黑 大 
学 的 许多 系 所 都 陈列 有 晶体 点 阵 结构 模型 ， 但 当时 并 没有 得 到 实验 证 实 。 


2.1.3 诺 贝 尔 奖 培训 班 


1914 一 1918 年 间 ， 慕 尼 黑 是 科学 发 现 和 艺术 进步 的 世界 中 心 。 绘 画 、 诗 
歌 和 物理 学 在 德国 巴伐利亚 州 首府 极其 繁荣 。 主 要 人 物 们 经 常 光顾 的 聚会 场 
所 是 位 于 霍 夫 花园 (Hofgarten) 的 咖啡 店 。 正 如 艾 略 特 〈T. S. Eliot, 1948 年 
诺 贝尔 文学 奖 获得 者 ) 在 “不 朽 的 荒原 ”(The Waste Land) 中 描写 的 那样 : 

Summer surprised us, coming over the Starnbergersee. 

《夏天 令 我 们 吃惊 ， 它 越过 斯 塔 恩 贝 格 湖 。) 

With a shower of rain; we stopped in the colonnade. 

GEKEN: 我们 躲 进 柱廊 里 。) 

And went on in sunlight, into the Hofgarten. 

(天 放晴 后 再 出 来 ， 进 入 霍 夫 花园 。) 

And drank coffee，and talked for an hour. 


(在 那里 喝 咖啡 , 谈 了 一 小 时 。) 
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霍 夫 花园 咖啡 店 的 咖啡 和 谈话 不 仅仅 是 诗人 们 的 特权 ， 也 为 来 自 附近 不 
同 大 学 的 物理 学 家 们 提供 了 一 个 非 正式 讨论 交流 的 好 场所 。 这 些 讨论 在 发 现 
X 射线 本 质 的 问题 上 将 起 到 重要 作用 。 这 些 咖啡 会 议 的 一 个 核心 人 物 就 是 索 
末 菲 。 索 末 菲 是 具有 良好 数学 基础 训练 的 理论 物理 学 教授 ， 为 了 弥补 物理 学 
实验 知识 的 不 足 ， 他 请 伦琴 的 助手 亚伯拉罕 。 乔 夫 (Abraham Joffe) 对 其 
进行 一 些 训 练 。 乔 夫 建 议 每 天 早晨 与 索 末 菲 在 霍 夫 花 园 咖 啡 店 会 面 交 流 实验 
物理 学 。 索 末 菲 开始 是 勤奋 的 学 生 ， 也 是 才华 出 众 的 老师 ， 这 个 非 正 规 会 面 
很 快 扩大 到 晶体 学 家 和 化 学 家 ， 与 周三 晚上 大 学 的 研讨 会 一 起 创建 出 一 种 当时 
很 特别 的 开放 、 创 造 性 学 术 氛 围 。 索 末 菲 一 生得 过 无 数 的 荣誉 ， 如 马克 斯 ， 普 
朗 克 奖章 、 洛 仑 兹 奖章 (Lorentz Medal)、 奥 斯 特 奖章 (Oersted Medal), 
选 人 皇家 学 会 、 美 国 国家 科学 院 、 俄 罗斯 科学 院 、 印 度 科 学 院 ， 以 及 许多 其 
他 在 柏林 、 幕 尼 黑 、 格 丁 根 、 威 尼斯 等 地 的 科学 院 ， 拥 有 许多 大 学 颁发 的 荣 
誉 博士 学 位 ， 唯 一 没有 得 到 的 是 诺 贝尔 奖 。 索 末 菲 知道 如 何 发 气 与 招募 优秀 
人 才 ， 提 升 他 们 对 物理 与 数学 的 兴趣 ， 培 育 他 们 成 为 理论 物理 的 精英 。 索 末 
菲 的 这 个 “ 索 末 菲 学 校 ” 有 多 达 7 位 校友 获得 了 诺 贝尔 奖 ， 包 括 沃 尔 纳 。 卡 
尔 。 海 森 堡 (Werner Heisenberg, 1932 年 获 诺 贝 尔 物理 学 奖 )、 彼 得 ， 约 
HK + 威廉。 WF (Peter Joseph William Debye, 1936 年 获 诺 贝尔 化 学 
奖 )、 伊 西 多 ， 艾 萨 克 ， 拉 比 〈Isidor Isaac Rabi, 美国 物理 学 家 ，1944 EH 
EDA SK). RRRA * HA) (Wolfgang Pauli, 奥地利 物理 学 家 ， 
1945 年 获 诺 贝尔 物理 学 奖 )、 汉 斯 ， 贝 特 (Hans Bethe， 美 国 物理 学 家 ， 
1967 年 获 诺 贝尔 物理 学 奖 ) ， 以 及 马克 思 “， + HE. 13 + HEF 1909 年 
作为 私人 教师 加 入 “ 索 末 菲 学 校 "， 马 上 就 被 这 里 “充满 X 射线 本 质 的 问 
题 ” 深 深 触动 。 


2.1.4 一 石 二 鸟 的 精巧 实验 设计 


彼得 。 保罗 ，。 埃 瓦 德 在 进行 关于 长 电磁 波 在 假定 的 晶体 空间 点 阵 上 的 行 
为 研究 中 遇 到 一 些 困 难 ， 于 1912 年 2 月 的 一 个 晚上 来 征求 劳 厄 的 建议 。 劳 
厄 无 法 回答 埃 瓦 德 的 问题 ， 但 他 的 思绪 开始 遐想 。 他 头脑 中 突然 出 现 了 一 个 
KR: 既然 光线 会 在 缝隙 与 光波 长 相近 的 光栅 上 产生 衍射 和 干涉 ， 那 么 如 果 
X 射线 是 一 种 波 的 话 ， 其 波长 又 是 可 见 光波 长 的 万 分 之 一 ， 那 么 晶体 原子 
(离子 ) 的 间距 可 能 正好 可 以 用 作 X 射线 的 天 然 光 栅 。 如 果 这 个 推论 成 立 的 
dá. 那么 当 用 X 射线 照射 晶体 时 就 应 能 在 照相 底片 上 观察 到 典型 的 干涉 亮 
点 图 案 。 在 一 次 滑雪 中 ， 劳 厄 和 索 末 菲 、 维 轧 〈W. Wien) 及 其 他 同事 谈 到 
这 个 想法 时 ， 得 到 了 全 票 质疑 ， 怀 疑 实验 的 可 行 性 ， 但 索 末 菲 仍然 大 方 地 允 
许 劳 厄 进行 这 项 探索 。 劳 厄 设计 了 实验 ， 在 X 射线 管 和 照相 底片 间 放 置 一 
块 硫酸 铜 晶 体 。 索 末 菲 的 助手 弗 里 德里 希 (Walter Friedrich) MEP (Paul 
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Knipping) 开始 了 实验 探索 ,在 经 历 了 起 初 的 一 些 无 结果 的 实验 后 ， 于 
1912 年 4 月 23 日 终于 成 功 ! X 射线 穿越 晶体 在 照相 底片 上 形成 了 亮点 图 
案 ,， 证 明了 推断 的 正确 性 。 在 一 个 精美 的 实验 中 ， 劳 厄 同 时 证 明了 X 射线 
的 波动 性 质 和 晶体 结构 的 空间 点 阵 性 质 。 当 劳 厄 接受 诺 贝尔 奖 时 ， 他 衷心 感 
谢 弗 里 德里 希 和 尼 平 在 这 项 发 现 中 的 贡献 ， 并 与 他 们 分 享 了 奖金 。 这 是 固体 
物理 学 研究 中 具有 里 程 碑 意义 的 发 现 ， 从 此 ， 人 们 可 以 通过 观察 衍射 图 案 研 
究 晶体 的 微观 结构 ， 并 且 对 生物 学 、 化 学 、 材 料 科 学 的 发 展 都 起 到 了 巨大 的 
推动 作用 。 

晶体 的 点 阵 结构 在 当时 虽然 还 是 一 种 假设 ，X 射线 波动 理论 正好 有 待 于 
证 明 ， 这 两 件 事 通过 讨论 晶体 光学 问题 “碰巧 ”在 劳 厄 的 脑子 里 形成 了 联 
系 ! 他 敏感 地 抓 住 了 晶 格 间距 的 数量 级 和 X 射线 波长 可 能 相近 的 可 能 性 ， 
从 而 可 起 到 X 射线 天 然 光 栅 的 作用 。 他 的 灵感 来 自 他 同时 对 这 两 个 互 不 相 
干 的 假设 都 有 明确 具体 的 概念 。 如 果 不 知道 晶体 的 点 阵 结构 的 假设 ， 也 不 知 
道 X 射 线 的 波动 理论 ， 他 永远 也 不 会 想到 推断 出 利用 晶体 进行 X 射线 入 射 
的 实验 设计 。 


2.2 父子 同心 : X 射线 晶体 学 


马克 思 ， 冯 。 劳 厄 发 现 X 射线 晶体 衍射 的 现象 为 测定 晶体 结构 奠定 了 
坚实 的 基础 。 两 个 英国 科学 家 ， 威 廉 ， 享 利 ， 布 喇 格 一 士 (Sir William 
Henry Bragg) 和 威廉 。 АТ, ЖИЕ (Sir William Lawrence 
Bragg) 开始 用 X 射线 衍射 测定 化 合 物 中 原子 在 晶体 中 的 位 置 。 

享 利 。 布 喇 格 发 明了 X 射线 分 光 计 ， 并 与 他 的 儿子 威廉 。 劳伦斯 ， 布 
喇 格 创立 了 用 X 射线 分 析 晶 体 结构 的 新 学 术 领 域 。 

劳伦斯 布 喇 格 1912 年 就 发 现 了 其 一 生 最 著名 的 成 就 一 一 布 喇 格 定 律 。 
布 喇 格 定律 给 出 了 受到 电磁 辐射 和 粒子 波 照射 时 ， 晶 体内 原子 平面 间隔 与 在 
该 平面 上 产生 最 强 反 射 的 人 射 角 之 间 的 关系 ， 可 以 用 于 测定 波长 和 晶体 的 点 
阵 间隔 距离 。 其 间 ， 他 与 在 利兹 大 学 研究 X 射线 分 光 计 的 父亲 进行 了 讨论 。 
父子 两 人 对 X 射线 衍射 的 研究 为 后 来 DNA 双 螺 旋 结 构 的 发 现 葛 定 了 基础 。 

1937 年 欧 内 斯 特 ， 卢 瑟 福 去 世 后 ,劳伦斯 . 布 喇 格 接替 他 成 为 剑桥 大 
学 卡 文 迪 什 实验 室 主任 。1948 年 ， 劳 伦 斯 布 喇 格 开始 对 蛋白 质 结构 研究 
产生 兴趣 ， 并 且 创建 了 一 个 使 用 物理 方法 解决 生物 问题 的 研究 小 组 。1953 
Æ DNA 双 螺 旋 结 构 的 发 现 ， 他 尽管 没有 直接 参与 研究 ， 但 也 做 出 了 贡献 ， 
在 他 的 支持 下 ， 弗 朗 西 斯 ， 克 里 克 (Francis Harry Compton Crick) ЯП ti 
Wi + KR (ames Dewey Watson) 在 卡 文 迪 什 实验 室 开展 这 方面 的 研究 。 
而 他 40 年 前 做 的 X 射线 研究 也 在 这 一 过 程 中 得 到 应 用 。 同 一 时 期 ， 马 克 
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斯 ， 佩 鲁 蒋 在 卡 文 迪 什 实验 室 开 展 血红 蛋白 研究 ， 后 来 他 也 因 这 项 研究 获得 
1962 年 诺 贝 尔 化 学 奖 。 经 劳伦斯 * 布 喇 格 提名 ， 克 里 克 、 沃 森 以 及 莫 里 
斯 ， 威 尔 金 斯 成 为 1962 年 诺 贝尔 生理 学 或 医学 奖 的 候选 ， 并 最 终 获 奖 。 

布 喇 格 父子 创立 了 用 X 射线 分 析 晶 体 结构 的 新 领域 ， 这 项 技术 的 应 用 
为 DNA 双 螺 旋 结构 的 发 现 和 蛋白 质 晶体 结构 的 测定 葛 定 了 基础 。 正 是 由 于 
这 项 成 就 ，1915 年 父子 两 人 一 同 被 授予 诺 贝尔 物理 学 奖 。 


2.3 蛋白 质 晶体 学 的 兴起 


2.3.1 蛋白 质 结构 


生物 大 分 子 相互 作用 是 各 种 生命 现象 和 生物 功能 的 物质 基础 和 本 质 。 如 
果 把 核酸 (DNA, RNA) 比喻 为 指导 细胞 内 各 种 活动 的 剧本 ， 那 么 蛋白 质 
就 既是 导演 又 是 “主要 演员 ”。 蛋 白质 不 断 与 核酸 相互 作用 〈 读 取 剧本 )， 按 
照 剧 本 创造 作为 主要 演员 的 蛋白 质 ， 蛋白 质 还 不 断 与 蛋白 质 相互 作用 ， 调 节 
蛋白 质 生物 活性 、 功 能 和 和 蛋白质 的 归宿 。 这 些 相互 作 用 都 依赖 于 这 些 生 物 大 
分 子 本 身 的 空间 结构 。 

自然 界 中 蛋白 质 主要 是 由 20 种 不 同 的 氨基 酸 通过 化 学 键 连接 成 一 个 长 
链 大 分 子 ， 链 上 和 氨基酸 的 排列 顺序 为 蛋白 质 分 子 的 一 级 结构 。 每 种 蛋白 质 分 
子 都 有 其 独特 的 一 级 结构 ， 具 有 生物 活性 的 蛋白 质 并 不 以 笔直 或 随意 弯曲 的 
飘带 形式 存在 ， 而 是 出 现 其 固定 的 空间 结构 (三 级 结构 )， 有 一 定 规律 性 的 
局 部 结构 ， 如 a- 螺 旋 、B- 折 倒 等， 称 为 蛋白 质 的 二 级 结构 。 有 两 个 或 更 多 相 
对 独立 的 链 可 以 形成 更 复杂 的 空间 结构 。 蛋 白质 分 子 的 一 级 结构 决定 了 其 空 
间 结 构 ， 正 常情 况 下 ， 氨 基 酸 序列 相同 的 蛋白 质 分 子 具 有 相同 的 空间 结构 。 
而 蛋白 质 分 子 相互 作用 的 活性 除 与 氨基 酸 序列 有 关 之 外 ， 还 依赖 于 整个 分 子 
的 空间 结构 。 有 正常 的 氨基 酸 序列 、 没 有 形成 特定 的 空间 结构 的 蛋白 质 分 子 
是 没有 生物 活性 的 ， 这 称 为 失 活 的 蛋白 质 分 子 。 要 了 解 生物 结构 现象 ， 了 解 
蛋白 质 晶体 结构 只 是 非常 重要 的 第 一 步 。 因 此 ， 研 究 生物 大 分 子 的 空间 结构 
一 直 是 整个 生命 科学 中 最 重要 、 最 活跃 的 领域 之 一 。 


2.3.2 多 萝 西 * EFE: 蛋白 质 结构 测定 时 代 的 起 始 


2B + ЖФ (Dorothy Hodgkin, 1964 年 诺 贝尔 化 学 奖 得 主 ) 1928 
年 进入 英国 牛津 大 学 萨 默 维尔 学 院 (Somerville College) 攻读 化 学 期 间 ， 被 
晶体 之 美 深 深 吸引 ， 于 1932 年 到 英国 剑桥 大 学 师 从 贝尔 纳 J. D. Bernal, 
英国 科学 家 ， 一 生 在 结晶 学 、 分 子 生物 学 、 科 学 社会 学 等 方面 有 过 许多 天 才 
的 思想 ) 攻读 博士 学 位 。 正 是 在 贝尔 纳 的 实验 室 ， 霍 奇 金 第 一 次 用 X 射线 
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技术 研究 生物 分 子 ， 用 她 自己 的 话 讲 这 是 “一 个 充满 新 发 现 的 时 期 ”。1934 
年 ， 他 们 收 到 瑞典 乌 普 萨 拉 大 学 斯 维 德 伯 格 实验 室 Claboratory of Theodor 
Svedberg, Uppsala University, Sweden) 的 约翰 。 菲 尔 波 特 (John 
Philpott) 制备 的 胃 和 蛋白酶 晶体 。 贝 尔 纳 发 现 维持 蛋白 晶体 不 干燥 的 重要 性 ， 
而 且 只 有 用 其 母液 保存 才能 得 到 清晰 的 X 射线 衍射 点 。 霍 奇 金 努 力 鉴定 这 
个 新 晶体 。 从 她 的 X 射线 衍射 照片 ， 他 们 推测 这 种 酶 由 直径 3. 5nm 和 
2. 5nm 扁 椭 球体 分 子 的 六 方 晶 格 组 成 ， 同 时 晶 格 中 还 含 大 量 共 结晶 水 ， 最 
重要 的 是 ， 从 衍射 点 强度 他 们 能 够 推断 其 中 的 原子 也 具有 完美 的 排列 。“ 从 
结晶 的 蛋白 质 可 以 制 取 X 射线 底片 ， 我 们 已 经 具备 了 查看 所 有 结晶 蛋白 结 
构 的 工具 ， 得 到 的 蛋白 质 结构 细节 比 物理 和 化 学 方法 精细 得 多 ”。1934 年 的 
这 篇 论文 标志 着 蛋白 晶体 学 的 开端 ， 进 入 了 一 个 新 的 纪元 。 在 近年 的 高 度 竞 
争 的 压力 下 ， 可 能 再 也 难 见 到 这 样 科学 研究 合作 的 成 功 案例 了 。 

格 兰 ， 弥 黎 获 博 士 是 一 个 年 轻 的 美国 人 ， 其 父亲 是 诺 贝尔 奖 获 得 者 罗 伯 
$F e R (Robert Millikan)， 很 熟悉 贝尔 纳 的 研究 。 他 看 到 胃 和 蛋白酶 晶 
体 的 第 一 个 直觉 就 是 贝尔 纳 会 很 高 兴 得 到 这 些 晶体 ， 于 是 就 拿 到 了 剑桥 。 直 
奇 金 和 贝尔 纳 用 实验 证 明 X 射线 衍射 强度 的 明显 变化 不 是 失去 生物 活性 的 
结果 ， 而 是 品格 变化 的 结果 。 霍 奇 金 进 行 蛋 白质 结晶 实验 开创 了 蛋白 质 结构 
测定 的 时 代 ， 因 而 获得 了 1964 年 度 的 诺 贝尔 化 学 奖 。 正 如 佩 鲁 茨 所 写 的 那 
PE, WARE K 射线 晶体 学 成 为 一 种 进行 天 然 物 质 化 学 组 成 测定 最 快 
的 方法 。 人 们 普遍 认为 ， 霍 奇 金 在 20 世纪 30 年 代 成 功 拍摄 的 胃 和 蛋白 酶 和 胰 
岛 素 X 射线 衍射 照片 是 蛋白 质 晶体 学 研究 历史 的 里 程 碑 。 


2.3.3 马克 斯 MER: 蛋白 质 结构 测定 技术 的 成 熟 


马克 斯 ， 佩 鲁 芯 (Max Ferdinand Perutz) 1932 年 进入 维也纳 大 学 ， 用 
他 自己 的 话说 是 “在 无 机 分 析 课 程 上 浪费 了 5 个 学 期 >。 Л. 卫斯理 
(F. von Wessely) 教授 的 课程 启发 了 他 对 有 机 化 学 (尤其 是 有 机 生物 化 学 ) 
的 好 奇 心 。1936 年 9 月 佩 鲁 茨 成 为 剑桥 大 学 卡 文 迪 什 实验 室 的 一 名 研究 学 
生 ， 指 导 老 师 是 贝尔 纳 。 此 后 ， 佩 鲁 茨 就 没有 离开 过 剑桥 。 和 希特勒 人 侵 奥 地 
利和 捷克 斯 洛 伐 克 后 ， 佩 鲁 茨 家 族 的 生意 被 没收 ， 他 的 双亲 流落 为 难民 ， 他 
自己 的 经 济 支 持 很 快 耗 尽 。 好 在 劳伦斯 *" 布 喇 格 事 土 (Sir Lawrence Bragg) 
用 从 洛克 菲 勒 基金 会 得 到 的 一 笔 研究 经 费 资 助 他 ，1939 年 1 月 1 日 任命 他 
为 研究 助理 。 由 于 战争 的 影响 ， 经 费时 断 时 续 地 维持 到 1945 年 ， 佩 鲁 茨 才 
争取 到 一 笔 帝国 化 学 工业 研究 奖学金 。1947 年 他 受聘 于 新 建立 的 医学 研究 
BAZ (Medical Research Council) 研究 分 子 生物 学 ， 全 体 员工 除了 他 只 有 
约翰 。 考 德 雷 。 肯 德 鲁 (John Cowdery Kendrew) 一 个 人 。 他 一 直 待 到 
1962 年 3 月 被 任命 为 医学 研究 委员 会 分 子 生物 学 实验 室 (Medical Research 
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Council Laboratory of Molecular Biology) 主任 。 这 些 年 他 一 直 坚 持 与 劳 伦 
斯 。 布 喇 格 珊 士 进行 合作 研究 。 

1938 年 初 ， 贝 尔 纳 、 范 库 谢 和 佩 鲁 茨 发 表 了 血红 蛋白 和 chymotrypsin 
晶体 X 射线 衍射 的 合作 研究 论文 [Nature, 1938 (141): 523]. BRA M 
晶体 是 双 晶 ， 难 以 研究 ， 佩 鲁 芯 就 选择 血红 蛋白 继续 研究 。 生 物 与 寄生 虫 学 
教授 凯 林 (D. Keilin， 剑 桥 大 学 ) 很 快 对 这 项 工作 产生 了 兴趣 ， 为 佩 鲁 蒋 和 
同伴 提供 了 生物 化 学 研究 设施 ， 而 这 些 正 是 卡 文 迪 什 实验 室 所 缺乏 的 。 因 
此 ， 从 1938 年 开始 到 50 年 代 早期 ， 蛋 白质 化 学 的 工作 一 直 在 凯 林 的 莫 尔 蒂 
诺 研究 所 (Molteno Institute) 进行 ，X 射线 方面 的 工作 在 卡 文 迪 什 实验 室 
进行 。 佩 鲁 芯 对 那些 天 才 同 事 能 够 加 入 一 起 工作 心 存 感激 ， 其 中 肯 德 鲁 
1946 年 加 入 ， 弗 朗 西 斯 。 克 里 克 1948 年 加 入 ,詹姆斯 * 沃 森 1951 年 加 入 ， 
弗 雷 德里 克 。 桑 格 (Frederick Sanger) 1958 年 加 盟 。 他 的 这 些 同事 都 先后 
获得 了 诺 贝 尔 奖 。 肯 德 鲁 和 佩 鲁 茨 (Max Ferdinand Perutz) 1937 年 开始 氧 
储存 蛋白 - 肌 红 蛋白 (myoglobin) 高 分 辩 率 结构 的 研究 工作 ， 于 1958 年 发 
表 论 文 ， 随 后 又 测定 了 氧 输 运 蛋白 -血红 蛋白 (hemoglobin) 的 高 分 辩 率 结 
构 。 肯 德 重 和 佩 鲁 茨 赢 得 了 1962 年 诺 贝尔 化 学 奖 。 蛋 白质 结构 与 克 里 克 和 
沃 森 早 5 年 发 表 的 脱氧 核糖 核酸 (deoxyribonucleic acid, DNA) 结构 相 比 ， 
极 不 规则 ， 表 现 出 形状 多 样 的 特点 。 这 种 结构 多 样 性 与 蛋白 质 功能 多 样 性 的 
关系 在 随后 的 时 间 里 得 到 了 更 多 的 证 明 。 

1958 年 开始 ， 佩 鲁 世 指导 罗斯 曼 (Michael Rossmann) 研究 血红 蛋白 
结构 时 发 展 了 分 子 置换 技术 (molecular replacement)， 可 以 已 知 结构 推断 
相关 但 未 知 结构 的 取向 和 位 置 。 

化 学 家 的 重要 工作 之 一 是 用 他 们 自己 的 方式 忠实 复制 化 合 物 的 结构 ， 其 
中 原子 是 建筑 材料 ， 总 原子 个 数 、 相 互 之 间 的 连接 点 和 连接 方式 即 为 原子 在 
空间 的 分 布 。 结 构 测 定 一 直 是 化 学 研究 的 最 重要 工作 ， 测 定 的 方法 也 很 多 。 
由 于 多 种 原因 ， 有 机 化 合 物 结 构 测定 曾经 发 展 很 迅速 ， 基 本 用 理论 化 学 就 能 
够 满足 需要 ， 可 以 从 化 合 物 的 反应 性 质 、 降 解 产物 以 及 用 简单 物质 进行 合成 
验证 ， 就 可 以 推测 出 原子 间 相互 连接 的 一 般 化 学 结构 ， 而 不 是 原子 间 精 确 距 
离 和 键 间 夹 角 。 然 而 ， 要 建立 结构 与 性 质 之 间 的 关系 ， 原 子 间 精确 距离 和 键 
间 夹 角 是 必 不 可 少 的 ， 只 有 通过 物理 方法 才能 测定 。 

XX 射线 遇 到 晶体 时 产生 向 特定 角度 的 衍射 ， 衍 射 的 角度 、 强 度 与 晶体 中 
原子 的 种 类 和 空间 发 布 相关 ， 因 此 可 以 进行 结构 测定 。 马 克 思 。 汉 “。 劳 厄 因 
发 现 这 个 衍射 现象 获 1914 诺 贝尔 物理 奖 ， 开辟 了 研究 X 射线 本 质 和 固 相 化 
合 物 结构 的 全 新 领域 。 布 喇 格 父子 1915 年 首先 发 展 出 了 测定 结构 的 方法 ， 
并 因此 也 获得 了 诺 贝 尔 物理 奖 。 

测定 方法 不 断 改 进 ， 能 够 测定 越 来 越 复杂 的 结构 ， 但 当 遇 到 不 那么 简单 
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的 结构 时 ， 就 遇 到 了 相当 大 的 困难 。 从 实验 数据 到 化 合 物 结构 之 间 没有 通用 
的 简单 方法 可 用 ， 数 学 计算 特别 耗 时 。 尽 管 这 样 ， 到 20 世纪 40 年 代 中 期 ， 
X 射线 衍射 能 够 测定 的 分 子 结构 比 其 他 经 典 化 学 方法 测定 的 都 复杂 得 多 。 

1937 年 还 没有 测定 蛋白 质 结构 的 方法 ， 佩 鲁 蒋 在 剑桥 实验 探索 用 X Ht 
线 衍射 测定 血红 蛋白 结构 的 可 能 性 。 劳 伦 斯 ， 布 喇 格 珊 士 不 知 疲倦 地 继续 开 
展 和 他 父亲 共同 开创 的 事业 ，1938 年 成 为 卡 文 迪 什 实验 室 的 主任 。 当 他 看 
到 佩 鲁 茨 获得 的 实验 数据 时 ， 对 佩 鲁 蒋 加 以 鼓励 ， 并 提供 了 很 有 效 的 支持 。 
血红 蛋白 是 在 生命 过 程 中 起 重要 作用 的 一 类 分 子 ， 是 生物 的 基本 成 分 ， 是 红 
细胞 的 功能 成 分 。 血 红 蛋 白 含 的 铁 在 肺 中 结合 氧 ， 然 后 在 身体 其 他 组 织 中 释 
放出 来 。 血 红 蛋 白 是 球 蛋白 的 一 类 ， 分 子 形状 近乎 球形 。 一 开始 就 选择 它 进 
行 研究 ， 一 方面 是 因为 正好 能 够 得 到 这 个 分 子 的 完美 结晶 ， 另 一 方面 对 于 蛋 
白质 来 说 ， 血 红 蛋 白 分 子 恰好 相当 小 ， 困 难 会 相对 小 一 些 ! KY 10 年 后 肯 
德 鲁 加 入 佩 鲁 获 研 究 组 后 ， 解 析 肌 红 蛋 白 结 构 的 任务 就 恰好 安排 给 了 肯 德 
鲁 。 肌 红 蛋 白 是 另 一 种 球 蛋白 ， 与 血红 蛋白 密切 相关 ， 而 其 大 小 只 有 血红 蛋 
白 分 子 的 1/4。 可 以 在 肌肉 中 找到 肌 红 蛋白 ， 在 那里 它 起 到 储存 氧 的 作用 。 
鲸 和 海豹 肌肉 组 织 中 的 肌 红 蛋白 特别 丰富 ， 因 为 它们 需要 能 够 存储 大 量 氧 ， 
满足 活 组 织 的 需要 。 

然而 佩 鲁 蒋 和 肯 德 鲁 遇 到 了 相当 大 的 困难 。 尽 管 他 们 进行 了 非常 全 面 的 
PRIME, HAMM RRO MF CHART) 吸收 到 血红 蛋白 晶体 
中 特定 位 置 ， 理 想 的 研究 结果 才 姗 媚 来 迟 。 这 样 衍射 图 案 会 发 生 某 种 变化 ， 
变化 本 身 能 够 直接 用 于 结构 测定 。 该 方法 在 当时 原则 上 已 经 公开 ， 但 佩 鲁 蒋 
在 新 的 高 度 使 用 得 更 加 熟练 。 肯 德 鲁 用 另 一 种 方法 使 肌 红 蛋白 晶体 吸收 重 原 
子 ， 其 处 理 方法 就 类 似 。 这 种 技术 的 必要 前 提 条 件 是 重 原子 的 掺 入 不 会 影响 
晶体 中 其 他 原子 的 位 置 。 就 此 而 论 ， 就 是 因为 分 子 几何 尺寸 相对 很 大 ， 蛋 白 
质 分 子 基本 不 变 。 布 喇 格 相当 贴切 地 指出 ， 蛋 白质 分 子 对 这 些 附 件 一 点 也 不 
在 乎 ， 就 如 印度 象 不 在 乎 额头 上 画 个 金星 ! 

尽管 直接 测定 血红 蛋白 和 肌 红 蛋白 的 路 线 已 经 走 通 ， 仍 然 有 大 量 数 据 需 
要 处 理 。 两 个 分 子 中 较 小 的 肌 红 蛋 白 约 含 2600 个 原子 ， 其 中 许多 原子 的 空间 
位 置 已 经 知道 。 这 些 结果 是 肯 德 鲁 研究 110 个 晶体 、 测 定 约 250000 幅 X 射线 
衍射 图 的 强度 才 得 到 的 。 如 果 不 使 用 计算 速度 较 高 的 电子 计算 机 的 话 ， 这 些 
计算 几乎 不 可 能 。 血 红 蛋 白 分 子 有 肌 红 蛋白 的 4 倍 大 ， 对 其 结构 了 解 更 少 。 这 
两 种 情况 需要 佩 鲁 蒋 和 肯 德 鲁 收集 更 多 的 映像 去 获得 结构 的 更 多 细节 。 

由 于 佩 鲁 蒋 和 肯 德 鲁 的 贡献 ， 现 在 知道 了 球 蛋白 的 结构 原理 ， 这 是 经 过 
25 年 艰难 探索 才 得 到 的 ， 尽 管 初 始 结果 并 不 完美 。 因 此 ， 让 我 们 佩服 的 不 
仅仅 是 两 位 科学 家 在 这 项 研究 工作 中 表现 出 的 天 才 和 技巧 ， 更 值得 我 们 学 习 
的 是 他 们 的 耐心 和 损 力 ， 正 是 这 种 人 类 独 有 的 优秀 品质 让 他 们 征服 了 那些 开 
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始 时 看 来 不 可 能 逾越 的 艰难 险阻 。 目 前 Brookhaven 蛋白 质 结 构 数据 库 
(Protein Databank, PDB) if 6 万 个 生物 分 子 三 维 结构 数据 (2009 年 ?月 
21 HO. 的 大 部 分 都 是 用 佩 鲁 蒋 和 肯 德 鲁 葛 定 的 X 射线 衍射 方法 测定 解析 的 。 
今天 我 们 能 够 更 加 确切 地 理解 这 些 生 命 必需 物质 结构 知识 的 发 现 和 积累 对 于 
阐明 生命 现象 本 质 的 重要 性 ， 也 更 能 够 清晰 认识 诺 贝 尔 设立 的 获奖 条 件 具 体 
实例 的 阐述 。 佩 鲁 蒋 和 肯 德 鲁 的 贡献 为 进一步 在 分 子 水 平 理 解 生 物 功能 的 结 
构 基础 打开 了 一 条 通 往 新 世界 的 大 门 。 


2.3.4 相位 问题 


对 于 佩 鲁 茨 来 说 ,证 明 X 射线 能 够 解析 生物 学 上 重要 的 蛋白 质 复杂 结 
构 不 仅 需要 灵感 ， 更 需要 毅力 。 

MOX 射线 穿 过 晶体 时 ， 常 常 被 原子 折射 〈deflect) ， 再 相互 影响 ， 生 成 
典型 的 scattered 图 案 ， 光 点 之 间距 离 也 极 有 规律 ， 这 就 是 X 射线 衍射 图 案 
(X-ray diffraction pattern) 。 布 喇 格 和 他 的 父亲 首先 发 现 这些 衍 射 图 案 能 够 
揭示 化 合 物 结构 ， 但 当 科学 家 用 布 喇 格 的 X 射线 晶体 学 方法 研究 越 来 越 复 
杂 的 结构 时 ， 很 快 就 发 现 了 方法 适用 的 局 限 性 ! 这 些 X 射线 波 碰 到 膜 后 形 
成 衍射 图 案 中 的 斑点 。 每 个 衍射 点 提供 的 信息 只 有 晶体 中 原子 偏 射 该 点 方向 
X 射线 波 的 振幅 ， 而 理想 情况 下 科学 家 也 想 知道 在 波动 周期 运动 中 一 个 峰 到 
下 一 个 峰 上 的 每 个 点 ， 即 波 的 相位 。 对 于 只 有 10 多 个 原子 的 分 子 来 说 ， 用 
19 世纪 法 国 数学 家 传 里 叶 (Joseph Fourier) 设计 的 将 复合 波 分 解 成 单 波 的 
公式 〈 即 傅 里 叶 变 换 方法 ) 就 可 以 从 衍射 图 案 和 波 的 振幅 数据 推算 出 分 子 结 
构 。 尽 管 推算 过 程 极其 艰辛 枯燥 、 耗 时 费力 ， 早 期 的 晶体 学 科学 家 几乎 总 是 
能 够 依靠 这 个 傅 里 叶 公式 ， 结 合 直觉 和 一 定 次 数 的 尝试 ， 找 到 正确 的 分 子 
结构 。 

而 当 遇 到 像 血红 蛋白 分 子 这 样 含 数 千 个 原子 的 大 分 子 时 ， 出 现 了 更 大 的 
困难 。 这 么 大 分 子 的 晶体 中 反射 和 相互 作用 的 数量 如 此 大 、 如 此 复杂 ， 导 致 
X 射线 衍射 图 案 转 化 为 分 子 结构 需要 更 多 的 数据 ， 而 仅仅 有 波 的 振幅 数据 是 
不 够 的 。 需 要 找到 一 个 方法 确定 衍射 图 案 中 每 个 衍射 点 形成 时 X 射线 波 的 
相位 〈phase) ， 推 算 大 分 子 结构 。 如 果 知 道 相 角 、 波 上 点 与 特定 参照 点 的 间 
距 ， 就 可 以 计算 出 相位 。 但 实际 上 用 傅 里 叶 变换 方法 或 其 他 任何 已 知 方法 都 
不 能 直接 计算 出 相位 。 

科学 家 称 这 种 相位 信息 缺失 的 情况 为 “相位 问题 ” (the phase prob- 
lem)， 在 当时 ， 解 决 这 个 问题 成 为 致力 于 用 X 射线 晶体 学 测定 蛋白 质 结构 
的 科学 家 们 的 终极 目标 。 在 缺失 相位 数据 的 情况 下 ， 科 学 家 求助 于 另 一 个 可 
以 绕 过 这 个 问题 的 方法 。 

帕 特 森 (Lindo Patterson) 在 1934 年 就 设计 出 了 傅 里 叶 变换 的 函数 ， 
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只 用 义 射 线 衍射 图 案 中 点 的 位 置 和 强度 就 能 够 画 出 等 场 强 线 图 ， 定义 晶 体 
中 原子 间 的 距离 。 帕 特 森 图 的 优点 是 没有 反射 的 相位 数据 也 能 解决 问题 ， 缺 
点 是 即使 对 于 简单 的 化 合 物 ， 画 帕 特 森 图 也 是 一 个 极其 耗 时 的 辛苦 劳作 ， 衍 
射 图 上 每 个 点 都 需要 进行 数 百 次 计算 。 此 外 ， 用 帕 特 森 图 也 不 能 保证 对 复杂 
化 合 物 能 够 处 理 成 功 。 

在 没有 其 他 方法 可 选用 的 情况 下 ， 佩 鲁 茨 只 得 创作 血红 蛋白 的 帕 特 森 
图 ， 他 自己 后 来 称 其 为 他 自己 领域 中 最 枯燥 和 最 差 的 工作 之 一 。 

克 里 克 认为 有 一 个 方法 可 能 会 成 功 解析 出 蛋白 质 的 结构 ， 那 就 是 格拉 斯 
哥 大 学 罗 伯 逊 (J.M. Robertson) 研究 有 机 小 分 子 所 用 的 同 晶 蔡 换 方法 。 在 
不 扰动 分 子 形状 的 前 提 下 向 晶体 中 引入 比分 子 中 原子 重 的 原子 ， 重 原子 携带 
更 多 的 电子 ， 散 射 X 射线 的 方式 不 同 。 含 重 原子 和 不 含 重 原子 的 两 幅 衍 射 
图 的 点 基本 相同 ， 强 度 不 同 的 关键 点 能 够 提供 给 科学 家 精确 定点 重 原子 的 位 
置 。 从 这 些 重 原子 位 置 可 计算 反射 X 射线 的 相位 。 当 时 没有 人 能 肯定 同 晶 
置换 方法 在 蛋白 质 结构 研究 方面 是 否 行 得 通 。 血 红 蛋 白 含 数 千 个 原子 ， 一 个 
重 原子 的 作用 有 多 大 ? 

佩 鲁 茨 推理 到 引进 重 原 子 的 方法 看 来 更 不 可 行 。 撤 开化 学 上 的 困难 不 
谈 ， 从 重 原子 散射 出 的 强度 是 否 大 到 能 变更 像 蛋白 质 这 样 大 的 分 子 的 绕 射 图 
形 ， 仍 是 个 问题 。 就 在 他 做 胀 缩 实 验 的 期 间 ， 这 个 希望 居然 有 了 曙光 ! 很 偶 
然 地 ， 他 比较 了 一 东 绕 射 和 和 人 射 的 X 射线 强度 ， 发 现 前 者 比 想象 中 的 弱 很 
多 ， 也 就 是 说 ， 大 部 分 蛋白 质 轻 原子 的 散射 强度 能 由 干涉 而 彼此 相 消 。 所 以 
用 一 重 原子 〈 如 尔 ) 来 取代 它们 ， 一定 能 产生 可 测 得 的 强度 改变 。 另 一 方 
面 ， 如 果 用 化 学 方法 将 重 原子 镀 人 血红 蛋白 中 ， 似 乎 大 部 分 的 重 原子 试剂 都 
会 使 蛋白 质变 性 。 

MZ 1953 年 6 月 收 到 哈佛 大 学 奥斯汀 ， 瑞 格 斯 (Austin Riggs) 的 一 
篇 论文 ， 使 他 更 接近 答案 一 步 。 瑞 格 斯 研究 镰 形 细胞 贫血 症 时 发 现 ， 血 红 蛋 
白 中 引入 汞 原子 不 影响 其 携 氧 能 力 。 也 就 是 说 ， 加 入 汞 原子 并 不 改变 血红 蛋 
白 结构 ! 

佩 鲁 获 把 血红 蛋白 晶体 温 泡 在 东 溶 液 中 ， 成 功 地 在 每 个 血红 蛋白 分 子 中 
АТ 2 个 汞 原子 ,拍摄 了 血红 蛋白 晶体 和 掺 入 汞 原子 的 晶体 的 X 射线 衍 
射 底片 。 几 个 星期 后 ，1953 年 夏天 ， 当 佩 鲁 芯 提心吊胆 地 洗 出 了 含 冬 血红 
蛋白 晶体 的 第 一 张 X 射线 照片 时 ， 两 种 血红 蛋白 晶体 的 衍射 图 案 正 有 想象 
中 的 强度 改变 。 佩 鲁 蒋 和 布 喇 格 在 看 两 张 照片 时 ， 意 识 到 这 个 困扰 他 们 16 
年 的 相位 问题 终于 解决 了 。 从 这 些 差异 ， 佩 鲁 茨 能 够 能 够 计算 出 冬 原 子 的 位 
置 ， 再 从 这 些 位 置 计算 一 套 血 红 蛋 白 反射 的 相位 。 

佩 鲁 茨 当时 想 ， 血 红 蛋 白 的 结构 最 多 花 一 年 时 间 就 能 解决 。 令 人 失望 的 
是 ， 这 次 得 意 竟 成 了 个 幻影 : 因为 晶体 的 “ 晶 格 混乱 ”， 使 得 相位 决定 法 无 
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用 武之 地 。 实 际 上 ， 佩 鲁 茨 花 了 6 年 时 间 才 制作 出 第 一 幅 血 红 蛋 白 的 低 分 辨 
率 结构 ， 他 一 再 证 明 “ 魔 鬼 总 在 细节 中 ”: 确定 相位 角 需 要 数 种 重 原子 摊 人 
的 晶体 [多 重 同 型 置换 法 ，mnultiple isomorphous replacement (MIR)]， 血 
红 和 蛋白 分 子 所 有 原子 的 坐标 需要 构建 等 ， 计 算 也 有 难度 …… 


2.3.5 又 是 相位 问题 : 核糖 体 结构 的 解析 


30 多 年 之 后 ， 以 色 列 女 科学 家 阿达 。 约 纳 特 CAda Yonath) 经 过 多 年 
的 孤独 探索 ， 终 于 制备 出 质量 完美 的 核糖 体 晶体 ， 衍 射 黑 点 图 案 很 精细 ， 足 
以 推算 核糖 体 三 维 结构 。 这 时 ， 相 位 问题 又 一 次 成 为 阻碍 。 

约 纳 特 1962 年 在 耶路撒冷 希 伯 来 大 学 获得 化 学 理学 学 士 学 位 ，1964 年 
获 生物 化 学 硕士 学 位 ，1968 年 ， 她 获得 魏 茨 曼 科 学 研究 所 的 晶体 学 博士 学 
位 。 此 后 她 先后 在 卡 内 基 梅 隆 大 学 (1969 年 ) 和 麻 省 理工 学 院 (1970 年 ) 
从 事 博士 后 研究 ， 在 那里 开始 接触 蛋白 质 晶体 学 。1970 年 她 回 到 以 色 列 ， 
协助 设立 了 以 色 列 的 首 个 也 是 随后 十 几 年 以 色 列 唯一 的 蛋白 质 晶 体 学 实验 
室 。 直 到 1974 年 约 纳 特 才 在 以 色 列 魏 茨 曼 科学 研究 所 稳定 下 来 ， 独 立 开 展 
结构 化 学 研究 工作 。 约 纳 特 博士 同时 带领 两 个 研究 组 ， 以色列 魏 茨 曼 科学 研 
究 所 和 德国 汉堡 马克 斯 - 普 朗 克 研 究 所 的 结构 分 子 生物 学 中 心 。 

约 纳 特 是 核糖 体 晶体 学 研究 的 先驱 。 她 的 研究 开始 于 20 世纪 70 年 代 后 
期 ， 远 早 于 大 多 数 人 认识 到 像 核糖 体 这 么 大 无 规则 结构 的 物质 也 能 够 结晶 之 
前 。 她 发 展 的 晶体 技术 很 快 就 得 到 广泛 认可 ， 成 为 常规 实验 技术 。 她 巧妙 地 
用 嗜 热 和 噬 盐 细菌 的 稳定 核糖 体 于 1980 年 制备 到 核糖 体 晶 体 。 这 些 细菌 的 
核糖 体制 备 的 晶体 具有 良好 的 X 射线 衍射 性 能 ， 而 大 肠 杆菌 和 其 他 来 源 的 
核糖 体 则 未 能 成 功 结晶 。 约 纳 特 还 是 冰冻 结晶 学 〈cryocrystallography) 的 
先驱 ， 那 是 一 种 快速 冰冻 晶体 以 最 大 程度 降低 强烈 X 射线 对 晶体 的 破坏 的 
“ 闪 冻 ”方法 。 约 纳 特 也 是 第 一 个 发 现 核糖 体内 部 充满 了 孔道 和 小 室 ， 包 括 
能 够 容纳 翻译 和 新 生 肽 的 洞 。 这 些 发 现 一 直 遭 到 质疑 ， 直 到 十 多 年 后 用 冰冻 
电子 显微镜 进行 了 证 实 才 结束 。 约 纳 特 博士 的 创新 技术 和 方法 记录 一 直 持 
续 ， 在 一 篇 论文 中 她 描述 了 如 何 通过 控制 加 热 和 mRNA 类 似 物 在 核糖 体 晶 
体 中 启动 蛋白 质 合 成 ， 再 用 各 种 化 合 物 保存 活化 的 核糖 体 晶体 。 后 来 她 集中 
研究 核糖 体 小 亚 基 ， 在 2000 年 9 月份 Cell 杂志 上 发 表 了 3. 3Ae 分 辩 率 结构 。 

突破 性 发 现 往往 来 自 先行 者 对 未 知 领域 的 探索 。 这 次 的 意志 坚强 的 先行 
者 是 约 纳 特 ! 20 世纪 70 年 代 末 ， 她 决定 尝试 用 X 射线 测定 核糖 体 的 结构 
这 在 当时 被 大 多 数 人 认为 是 不 可 能 的 事 。 实 际 上 ， 蛋 白质 晶体 学 中 X 射线 
测定 结构 的 第 一 步 ， 也 是 最 困难 和 最 重要 的 步骤 是 制备 蛋白 质 晶体 ， 要 求 形 
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成 的 晶体 几乎 没有 缺陷 : 分子 以 精确 的 方式 重复 排列 。 如 果 幸 运 的 话 ， 当 盐 
水 缓慢 蒸发 ， 就 会 生成 美丽 的 晶体 。 但 如 果 加 热 沸腾 至 干 的 话 ， 只 能 得 到 一 
层 白色 粉末。 条 件 不 同 ， 生 成 的 晶体 质量 不 同 ，X 射线 晶体 学 即 为 这 种 情 
况 。 制 备 高 品质 蛋白 质 晶体 是 一 件 非常 棘手 的 工作 ， 蛋 白质 复合 物 越 大 ， 结 
晶 的 难度 也 越 大 ， 因 此 很 多 人 怀疑 约 纳 特 想法 成 功 的 可 能 性 。 核 糖 体 是 最 复 
杂 的 蛋白 质 和 核糖 核酸 复合 物 之 一 。 可 以 分 为 小 亚 基 和 大 亚 基 两 部 分 。 人 类 
核糖 体 小 亚 基 包含 1 个 长 КМА 分 子 和 32 个 蛋白 质 分 子 ; 大 亚 基 含 3 个 
RNA 分 子 和 约 46 个 蛋白 质 分子 。 因 此 ， 每 个 亚 基 都 包含 数 千 核 苷 酸 和 氨基 
酸 ， 换 算 成 原子 的 话 有 数 十 万 之 多 。 约 纳 特 计划 建立 包括 核糖 体 中 每 个 原子 
精确 的 空间 位 置 的 结构 图 。 

约 纳 特 决定 制备 核糖 体 晶 体 时 ， 她 选择 从 生活 在 极端 环境 下 的 细菌 着 
手 。Geobacillus stearothermophilus 能 够 在 热 泉 环境 下 成 活 ， 热 泉 温度 高 达 
75°C 。 约 纳 特 的 假设 是 要 耐 受 这 么 高 温度 ， 核 糖 体 必须 极 稳定 ， 因 此 ， 其 核 
糖 体 有 可 能 形成 品质 高 的 晶体 。1980 年 ， 她 成 功 建立 了 核糖 体 大 亚 基 的 第 1 
个 三 维 结构 。 尽 管 晶体 并 不 完美 ， 但 也 是 一 个 巨大 的 成 就 。 约 纳 特 又 投入 了 
20 多 年 时 间 ， 才 建立 含 所 有 原子 位 置 的 核糖 体 结构 图 。 

约 纳 特 还 进行 了 许多 其 他 创新 ， 如 用 液 氮 将 晶体 冷却 到 一 196%C 以 稳定 
晶体 ， 用 其 他 适应 性 强 的 微生物 的 核糖 体 进行 晶体 实验 ， 其 中 的 一 种 与 死海 
Wet MAE Haloarcula marismortui 非常 相似 。 约 纳 特 一 步 一 个 脚印 ， 逐 
渐 接 近 了 目标 。 最 终 大 家 都 认识 到 核糖 体 原子 结构 测定 的 可 能 性 ， 越 来 越 多 
的 科学 家 加 入 了 竞争 队伍 。 其 中 包括 托马斯 * 施 泰 芯 (Thomas Arthur 
Steitz) 和 文 卡特 拉 曼 。 拉 马克 里 希 南 (Venkatraman Ramakrishnan). Ж 
泰 茨 是 美国 生物 化 学 家 ，1963 年 在 哈佛 大 学 听 佩 鲁 茨 的 报告 受到 启发 ， 选 
择 进入 结构 生物 学 领域 。1966 年 获得 哈佛 大 学 分 子 生物 学 和 生物 化 学 博士 
学 位 ， 曾 在 剑桥 大 学 分 子 生物 学 实验 室 (LMB) 作 博 士 后 ， 现 为 耶鲁 大 学 
分 子 生 物 物 理学 和 生物 化 学 系 的 斯 特 林 教授 ， 以 及 霍华德 。 休 斯 医学 研究 所 
的 研究 员 。 拉 马克 里 希 南 1971 年 在 印度 巴 罗 达 大 学 获 物理 学 学 士 学 位 ， 
1976 年 在 美国 俄亥俄 大 学 获 物理 学 博士 学 位 ，1976 一 1978 年 在 加 州 大 学 圣 
选 哥 分 校 获 生物 学 研究 生 学 位 ，1978 一 1982 年 在 耶鲁 大 学 化 学 系 做 博士 后 。 
1999 年 至 今 在 英国 剑桥 大 学 MRC 分 子 生物 学 实验 室 工作 。 

百 万 黑 点 图 谱 充 满 了 意义 。 在 20 世纪 90 年 代 初 ， 约 纳 特制 备 的 晶体 已 
经 具有 相当 高 的 品质 ， 图 谱 上 的 衍射 点 足够 确定 核糖 体 晶体 中 每 个 原子 的 位 
置 。 然 而 ， 还 存在 一 个 相当 大 的 困难 : 又 是 X 射线 晶体 学 的 相位 问题 ! 要 推 
算 结 构 ， 科 学 家 还 需要 知道 每 个 衍射 点 的 相位 角 。 这 个 数学 信息 与 晶体 中 原 
子 的 位 置 相关 。 科 学 家 确定 相位 的 一 个 常用 方法 是 把 晶体 用 重 原 子 Ce) 
浸泡 ， 重 原子 会 附着 在 核糖 体 晶体 的 表面 ， 通 过 比较 有 无 重 原子 的 晶体 衍射 
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图 ， 科学 家 就 能 够 确定 相 角 。 而 问题 在 于 ， 核 糖 体 太 大 了 ， 附 着 的 重 原子 很 
多 ， 难 以 快速 确定 相位 角 ， 因 此 解决 相位 问题 需要 更 多 的 信息 。 

托马斯 * AEH (Thomas Arthur Steitz) 成 功 解决 了 核糖 体 结构 研究 
中 的 “相位 问题 ” (phase problem)。 施 泰 茨 用 电子 显微镜 专家 Joachim 
Frank 测定 的 核糖 体 图 像 ， 确 定 了 晶体 中 每 个 核糖 体 的 取向 和 位 置 〈 分 辩 率 
不 足以 确定 每 个 原子 的 位 置 )。 根 据 这 些 信 息 ， 加 上 重 原子 信息 ， 最 终 成 功 
推算 出 了 相位 角 。1998 年 施 泰 茨 发表 了 核糖 体 大 亚 基 的 第 一 个 晶体 结构 ， 
就 像 一 张 模糊 的 照片 ， 分 辩 率 只 有 9A， 看 不 到 单个 原子 ,但 足以 发 现 核糖 
ЖК RNA 分 子 。 这 是 一 个 决定 性 的 突破 ， 相 位 问题 终于 解决 了 ! 剩 下 的 问 
题 就 是 提高 晶体 质量 ， 收 集 更 多 数据 ， 以 提高 核糖 体 图 像 的 清晰 度 。 

从 1998 年 初 开始 ， 有 效 数据 不 断 开始 积累 。2000 年 8 月 和 9 月 ，2009 
年 诺 贝尔 化 学 奖 的 三 位 获得 者 分 别 曾 明 了 原子 分 辩 率 的 核糖 体 晶体 结构 。 施 
泰 茨 得 到 了 Haloarculamarismortui 核糖 体 大 亚 基 的 结构 ， 约 纳 特 和 拉 马 克 
里 希 南 得 到 了 Thermus thermophilus 核糖 体 小 亚 基 的 结构 。 这 些 成 绩 使 在 
原子 水 平 研究 核糖 体 功能 与 结构 的 关系 成 为 可 能 。 


2.4 核磁 共振 方法 


2.4.1 傅 里 叶 变换 和 多 维 核磁 共振 


1991 年 诺 贝 尔 化 学 奖 授予 了 瑞士 苏黎世 联邦 理工 学 院 的 理 查 德 。 罗 伯 
特 ， 恩 斯 特 (Richard R，Ernst)， 表 彰 他 对 核磁 共振 光谱 (NMR) 测定 的 
方法 学 发 展 (methodological developments). HESE, Riti EMRE 
学 最 重要 的 光谱 学 工具 ， 能 够 用 于 研究 溶液 中 小 分 子 和 大 分 子 的 精细 结构 ， 
提供 分 子 移动 和 相互 作用 的 信息 。 术 语 “methodological developments” 指 
新 理论 、 新 实验 方法 或 革命 性 改进 。 简 要 回顾 化 学 的 发 展 , 甚至 整个 自然 科 
学 的 发 展 历 史 ， 不 难看 出 ， 科 学 研究 方法 学 的 发 展 和 进步 常常 对 科学 的 进步 
具有 重大 影响 。 

恩 斯 特 在 科学 生涯 的 初期 就 发 展 了 传 里 叶 变换 和 脉冲 核磁 共振 技术 
(Fourier transformation and pulse techniques in NMR spectroscopy), 提高 
检测 灵敏 度数 十 倍 乃 至 上 百倍 。 核 磁 共 振 技 术 的 “ 阿 喀 琉 斯 之 路 ”是 灵敏 度 
低 ， 健 里 叶 变 换 的 引入 弥补 了 这 个 最 大 的 缺点 , 从 而 可 以 进行 少量 物质 中 重 
要 元 素 原子 核 的 极 弱 信号 的 测定 , WSC AYN, 

核磁 共振 技术 一 个 革命 性 的 发 展 是 恩 斯 特 基 于 Jean Jeener 的 突破 性 思 
想 发 展 的 多 维 频率 空间 ， 二 、 三 甚至 更 多 维 核磁 共振 技术 ， 让 科学 家 不 仅 能 
够 记录 化 学 位 移 ， 也 能 记录 核 旋 之 间 的 相互 作用 ， 分 辩 分 子 中 特定 原子 被 化 
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学 键 连接 到 哪个 原子 ， 以 及 周围 空间 存在 哪些 原子 , 化 学 反应 中 哪些 原子 发 
生 了 交换 。 

恩 斯 特 回顾 了 核磁 共振 技术 发 展 过 程 ， 他 认为 ， 核 旋 研 究 是 理论 物理 学 
家 也 是 实验 物理 学 家 的 天 堂 , 能够 用 最 简单 的 实验 装置 检验 量子 力学 和 量子 
统计 学 的 基本 概念 。 核 旋 系 统 操作 的 简易 性 质 也 决定 了 其 可 以 检验 新 实验 概 
念 。 光 谱 学 的 通用 方法 主要 在 核磁 共振 领域 得 到 重要 发 展 ， 并 在 多 个 领域 得 
到 应 用 。 实际 上 ， 核 磁 共 振 领 域 的 重大 实验 进展 不 乏 科学 大 师 们 的 身影 : 伊 
WEAR ERE. EHE 〈Isidor І. Rabi) 建立 了 分 子 束 磁 性 共振 检测 方法 ， 
为 此 他 被 授予 1944 年 诺 贝 尔 物理 学 奖 ; 爱德华 。 米尔。 斯 珀 塞 尔 (Edward 
M. Purcell) 和 瑞士 物理 学 家 费 利克 斯 ， 布 洛 赫 (Felix Bloch) 发现 了 核磁 
共振 精密 测定 物质 结构 和 性 能 的 方法 , 发 展 成 为 核磁 共振 成 像 (MRI 检查 )， 
这 成 为 20 世纪 最 重要 的 医疗 设备 之 一 ， 他 们 共享 1952 年 诺 贝 尔 物理 奖 ; 阿 
尔 弗 雷 德 。 卡 斯 特 勒 (Alfred Kastler) 与 让 。 布 罗 塞 尔 (Jean Brossel) 合 
HE, 他 们 研究 了 量子 力学 、 光 与 原子 之 间 的 相互 作用 以 及 光谱 , 还 研究 了 光 
共振 和 磁 共振 的 结合 , 发 展 出 光 泵 技术 , 提出 了 激光 器 和 微波 发 射 器 理论 。 
因为 用 于 研究 原子 中 赫兹 共振 的 光学 方法 被 授予 1966 年 诺 贝尔 奖 。 此 外 ， 
与 核磁 共振 领域 相关 的 诺 贝尔 物理 奖 获 得 者 还 有 约翰 。 凡 弗 莱克 John Н. 
Van Vleck), 他 发 展 了 逆 磁 和 顺 磁 理 论 ， 将 矩 量 法 引入 了 核磁 共振 领域 ; 尼 
可 拉 斯 。 布 隆 伯 根 (Nicolaas Bloembergen) 对 早期 弛 豫 理 论 和 测定 作出 了 
HARM, KA + 亚历山大， BH (Karl Alex Müller) 对 电子 顺 磁 共振 具 
有 突出 贡献 ; 诺 曼 ，。 拉 姆 齐 (Norman Е. Ramsey) 则 发 展 了 化 学 位 移 和 J 
耦合 (J couplings) 理论 ; WM + 德 默 尔 特 (Hans С. Dehmelt) 发 展 了 纯 
核 四 极 矩 共振 。 

和 矩 量 法 (moment method) 

一 种 将 连续 的 微分 或 积分 方程 离散 化 为 代数 方程 的 电磁 场 数值 解法 ， | 
| 广泛 应 用 于 积分 方程 的 求解 。 它 首先 将 竺 求 场 的 微分 或 积分 方程 写成 带 有 | 
} 微分 或 积分 算 符 的 算 子 方程 ， 再 将 待 求 场 函 教 展开 为 某 一 Bike X nd | 
; 的 线性 组 合 代入 方程 ， 然 后 用 一 组 选 定 的 权 函 数 分 别 对 所 得 方程 取 内 积 ， Н 
(给 量 )， 从 而 得 到 一 个 矩阵 方程 或 代数 方程 组 ， 进而 解 该 方程 得 到 展开 基 | 
| 函数 的 各 系数 ， 从 而 得 到 待 求 场 函 数 的 近似 解 。 它 能 够 解决 一 些 边界 比较 | 
1 复杂 的 电磁 问题 ， 特别 广泛 应 用 Ба lack ЫЙА, аа EN 


核磁 共振 不 仅 激 发 了 物理 学 家 的 广阔 遐想 ， 也 吸引 了 越 来 越 多 的 化 学 
家 、 生 物 学 家 、 医 学 家 。 核 磁 共 振 的 魅力 不 仅 在 于 概念 的 美妙 ， 还 在 于 它 出 
平 意料 的 广泛 用 途 。 已 发 明 出 来 一 系列 核磁 共振 工具 ， 以 增强 其 在 多 个 领域 
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的 功能 ， 核 旋 系 统 的 特性 具有 研究 分 子 性 质 的 先天 优势 。 

自然 的 核 探 子 位 于 被 测量 对 象 数 飞 米 直径 范围 内 的 空间 位 置 ， 能 够 感知 
最 临近 空间 发 生 的 变化 , 因此 能 够 探测 分 子 和 物质 的 精细 性 质 。 这 些 探 子 与 
环境 间 的 相互 作用 能 量 极 低 , 小 于 0. 2J/mol, 相当 于 30mK 温度 下 热 运动 的 
能 量 ， 在 检测 分 子 性 质 时 还 几乎 不 存在 扰动 ， 相 互 作用 对 局 部 环境 高 度 敏 
感 ， 可 通过 核对 子 间 相互 作用 采集 几何 信息 ， 磁 极 子 相互 作用 可 提供 距离 信 
息 , Ti J $84 (scalar J coupling interactions) 又 能 进一步 提供 键 角 。 
mmi. 罗伯特 BMI (Richard R. Ernst) 小 传 : 

理 查 德 。 罗 伯 特 ， 恩 斯 特 (Richard RErnst)， 出 生 于 瑞士 温 特 图 尔 | 
} (Winterthur ，Switzerland) ， 从 苏黎世 联邦 技术 学 院 于 1957 年 获得 化 学 
Pies. 1962 年 获 物 理化 学 博士 学 位 。1963 一 1968 年 ， 他 在 加 州 帕 洛 阿尔 ; 
i 托 (Palo Alto) 从 事 化 学 研究 ，1966 年 ， 与 美国 同事 一 HAMA RAL | 
| 短 脉 冲 无 线 电波 代 赫 传统 核磁 共振 光谱 谱 仪 中 使 用 的 慢 扫描 电压 波 | 
(sweeping radio wave) 能 够 大 幅 提 高 核磁 共振 技术 的 灵敏 度 (当时 只 能 
; 测定 有 限 几 个 原子 核 )。 他 的 发 现 使 测量 微量 物质 和 更 多 类 型 的 原子 核 材 ; 
村 成 为 可 能 。1968 年 ， 他 回 到 瑞士 母校 任教 他 对 核磁 共振 领域 的 第 二 | 
; 个 重大 贡献 是 发 展 出 “两 维 ”高 分 辨 技术 ， 从 而 能 够 研究 此 前 的 核磁 共振 | 
| 光谱 仪 不 能 研究 的 “大 分 子 "。 思 斯 特 的 创新 成 果 让 科学 家 能 够 测定 生物 | 
;系统 的 有 机 分 子 和 无 机 分 子 ， 如 蛋白 质 分 子 的 结构 ， 研究 生物 分 子 与 其 他 | 
; 物质 如 金属 离子 、 水 分 子 以 及 药物 分 子 的 相互 作用 ， 鉴 定 分 子 种 类 和 研究 ; 
; 化 学 反应 的 过度 。 为 了 表 闵 思 斯 特 在 帕 洛 阿尔 托 瓦 里 安 公司 (Varian As- | 
i sociates , Palo Alto) 发 展 起 来 的 傅 里 叶 变 换 核磁 共振 光谱 仪 和 后 来 发 展 | 
;多维 核磁 共振 技术 这 些 杰 出 贡献 ， 他 被 授予 1991 年 诺 贝 尔 化 学 奖 。 这 些 ; 
; 发 现 都 丽 固 核磁 共振 在 化 学 分 析 〔 核 磁 共 扳 光 谱 ) 和 医学 临床 检查 CMRI i 
1 RAR) 的 应 用 。1991 PERAS HF AERE (Louisa Gross Hor- ! 


{ witz Prize). 


2.4.2 测定 蛋白 质 结构 的 核磁 共振 方法 


传统 方法 采用 X 射线 晶体 衍射 方法 测定 蛋白 质 分 子 的 空间 结构 。 首 先 需 
要 制备 高 品质 蛋白 质 结晶 ， 需 要 数 月 甚至 数 年 时 间 收 集 X 射线 晶体 衍射 数 
据 ， 再 用 计算 机 解析 衍射 数据 建立 蛋白 质 晶体 结构 。 晶 体 中 有 规律 、 紧 密 地 
排列 在 一 起 的 蛋白 质 分 子 被 局 限 在 晶 格 中 ， 运 动 性 较 差 ， 其 空间 结构 与 在 生 
物 细胞 内 蛋白 质 分 子 的 本 来 结构 可 能 存在 较 大 的 差别 。 而 细胞 中 的 天 然 蛋白 
质 分 子 一 直 处 于 溶液 状态 ， 周 围 是 水 分 子 和 其 他 的 生物 分 子 形成 的 微 环境 ， 
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有 一 定 的 运动 性 。 有 些 蛋 白质 只 能 稳定 地 存在 于 溶液 状态 ， 无 法 结晶 。 绝 大 
多 数 种 类 的 蛋白 质 也 难以 结晶 , 因此 蛋白 质 结晶 是 X 射线 晶体 衍射 方法 测定 
蛋白 质 分 子 的 空间 结构 的 瓶颈 。 

1978 年 ， 维 特 里 希 发 现 的 核 Overhauser 效应 (nuclear Overhauser 
effect) 能 够 用 于 测量 被 键 连接 相 邻 原子 网 络 的 核磁 共振 测定 蛋白 质 结构 的 
方法 。 首 先 测定 水 溶液 中 的 蛋白 质 样品 ， 获 得 一 系列 不 同 的 二 维 核磁 共振 图 
谱 ， 然 后 从 蛋白 质 分 子 的 一 级 结构 出 发 ， 通 过 比较 和 解析 一 系列 二 维 核磁 共 
振 图 谱 ， 找 到 各 个 氨基 酸 各 种 氢 原 子 在 图 谱 上 所 对 应 的 峰 。 再 根据 这 些 峰 在 
核磁 共振 图 谱 上 所 呈现 的 相互 之 间 的 关系 计算 相应 的 氢 原 子 之 间 的 距离 。 在 
一 级 序列 上 相差 甚 远 的 两 个 氨基 酸 在 空间 距离 上 有 可 能 很 近 ， 其 氢 原 子 的 
NMR 信号 峰之 间 就 会 呈现 偶 联 和 相互 作用 。 关 联 信和 号 的 出 现 揭 示 两 个 氢 原 
子 之 间距 离 小 于 0. 5nm。 和 蛋白 质 分 子 由 几 十 个 氨基 酸 残 基 组 成 的 话 就 可 以 
获得 几 千 个 与 距离 有 关 的 信号 ， 转 换 成 对 应 的 氢 原 子 之 间 的 距离 ; 以 这 些 距 
离 参数 和 化 学 上 有 关 原 子 与 原子 结合 的 参数 ， 如 原子 间 的 化 学 键 长 、 键 角 和 
原子 半径 等 基本 限制 条 件 ， 用 计算 机 程序 模拟 出 该 蛋白 质 分 子 的 空间 结构 。 
这 种 结构 测定 方法 避免 了 蛋白 质 结晶 这 个 耗 时 费力 的 技术 瓶颈 ， 从 而 能 更 
快 、 更 可 靠 地 确定 生物 大 分 子 的 组 成 和 空间 结构 ， 是 具有 革命 性 的 分 析 方 
法 。 在 溶液 中 的 蛋白 质 分 子 ， 更 接近 于 其 在 生物 细胞 中 的 自然 状态 ， 因 而 在 
溶液 状态 测定 的 蛋白 质 结构 也 更 真实 。 通 过 改变 溶液 的 性 质 ， 能 够 模拟 细胞 
内 各 细胞 器 中 的 各 种 微 环境 ， 更 接近 蛋白 质 发 挥 生物 功能 的 结构 。 在 溶液 环 
境 中 ， 蛋 白质 分 子 结构 表面 的 一 些 松散 链 段 的 运动 性 更 容易 表现 出 来 ， 为 研 
究 蛋 白质 与 蛋白 质 、 蛋 白质 与 底 物 或 小 分 子 的 相互 作用 提供 了 一 个 有 效 的 观 
察 手段 。 

把 核磁 共振 分 析 方 法 应 用 到 了 生物 大 分 子 〈 蛋 白质 和 核酸 ) 的 结构 研究 
中 ， 建 立 了 一 套 完整 的 确定 生物 大 分 子 空间 结构 的 革命 性 方法 ， 这 项 开创 性 
成 就 为 维特 里 希 赢 得 了 1982 年 诺 贝 尔 化 学 奖 ， 成 为 该 学 院 第 二 位 因 核 磁 共 
振 方法 而 荣 麻 诺 贝尔 奖 殊荣 的 教授 。1991 年 恩 斯 特 教授 因 其 在 核磁 共振 理 
论 方面 的 贡献 而 获得 当年 的 诺 贝尔 化 学 奖 。 

1976 以 后 , 维特 里 希 、 恩 斯 特 、Kuniaki Nagayama, Anil Kumar 共同 
发 展 出 了 多 种 多 维 核磁 共振 实验 技术 (2D NMR experiments) ， 形 成 了 核磁 
共振 测定 蛋白 质 结构 的 基础 。1982 年 格 哈 特 。 瓦格纳 (Gerhard Wagner) 
和 库 尔 特 。 维特 里 希 (Kurt Wiithrich) 发 表 了 碱 性 胰 蛋 白 酶 抑制 剂 ( 一 个 
小 分 子 量 蛋白 质 ) 的 序列 特异 NMR 信号 归属 。 同 时 ， 维 特 里 希 研究 组 的 沃 
h + HIE (Werner Braun) 和 蒂 莫 西 。 哈 维尔 (Timothy Havel) 建立 了 
从 核磁 共振 数据 计算 蛋白 质 结构 的 算法 和 软件 。1985 年 , 迈克尔 。 威廉 姆 
森 〈Michael Williamson)、 险 维尔 和 维特 里 希 报 道 了 第 一 个 蛋白 质 一 一 精液 
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ЖН A RI ПА 的 溶液 结构 , 但 其 研究 结果 一 开始 就 遭 到 怀疑 。 直 到 有 几 
个 核磁 共振 方法 解析 的 蛋白 质 结构 被 随后 的 X 射线 衍射 方法 解析 验证 后 ， 
核磁 共振 方法 测定 的 蛋白 质 结构 才 开始 被 广泛 认可 。 此 后 ， 核 磁 共 振 测定 蛋 
白质 结构 技术 又 有 了 跨越 性 发 展 ， 设 备 的 进步 使 能 够 利用 的 磁场 越 来 越 强 。 
计算 机 处 理 器 的 进步 使 计算 速度 越 来 越 快 ， 基 因 重 组 技术 可 以 将 多 种 同位 素 
富 集 挫 人 蛋白 质 样品 中 ， 使 核磁 共振 测定 技术 从 原来 单一 的 核发 展 到 三 种 甚 
至 四 种 核 在 一 个 实验 中 同时 共振 而 产生 相关 信号 ， 由 二 维 的 核磁 共振 实验 发 
展 成 三 维 甚至 更 多 维 的 实验 。 核 磁 共 振 方法 的 应 用 也 从 蛋白 质 分 子 结构 研究 
发 展 到 研究 蛋白 质 动力 学 、 蛋 白质 与 蛋白 质 、 蛋 白质 与 核酸 及 小 分 子 的 相互 
作用 ,以 及 药物 筛选 领域 。 

目前 通过 核磁 共振 测定 的 蛋白 质 的 空间 结构 已 经 有 几 百 种 ， 占 全 部 已 测 
定 蛋 白质 空间 结构 总 数 的 20% 左 右 。 一 部 分 蛋白 质 结构 分 别 有 核 磁 共 振 结 
构 数据 和 X 射线 晶体 衍射 结构 数据 ， 结 构 对 比 揭示 其 骨架 部 分 高 度 重 得 
局 部 的 表面 区 域 呈现 明显 的 环境 诱导 的 差异 。 目 前 用 核磁 共振 方法 研究 蛋白 
质 的 空间 结构 还 局 限于 中 、 小 蛋白 质 ， 即 大 约 几 百 个 以 下 氨基 酸 残 基 组 成 的 
蛋白 质 分 子 ， X 射线 晶体 衍射 的 方法 可 以 运用 于 真正 的 蛋白 质 分 子 。 


2.5 蛋白 质 结构 测定 的 其 他 辅助 工具 


2.5.1 实验 方法 


1962 年 ， 迈 克 尔 。 罗斯 曼 在 剑桥 大 学 发 展 了 分 子 替 代 方 法 ， 能 够 从 已 
知 结构 出 发 推测 出 相关 蛋白 未 知 结构 的 取向 和 位 置 。 

1969 年 ， 班 恩 。 ØRE (Benn P. Schoenborn) 证 明 中 子 衍射 可 以 测 
定 生物 分 子 中 氧 原子 的 固定 位 置 。 

1983 年 ， 德 国 科 学 家 页 桂 。 杜 布 守 (Jacque Dubochel) 用 玻璃 体 冰 冻 
方法 成 功 制备 出 水 化 生物 样品 的 非 染色 冰冻 样品 ， 玻 璃 化 , 或 称 之 为 生物 样 
品 无 定形 冰冻 方法 ,已 经 成 为 冰冻 电镜 的 关键 技术 。 

1989 4E, MH - Жї (Haken Hope) 发 展 出 在 冰冻 温度 下 采集 生物 大 
分 子 晶 体 衍 射 数据 的 新 方法 , 极 大 降低 了 辐射 对 晶体 样品 的 破坏 。 


2.5.2 计算 及 结构 显示 工具 


1971 年 在 美国 布鲁克 林 国 家 实验 室 (Brookhaven National Laboratory) 
建立 了 蛋白 质数 据 库 (protein data bank)， 存 放 蛋 白质 和 核酸 的 三 维 结构 数 
据 ， 开 始 只 有 7 个 结构 数据 ， 到 2009 年 7 H 21 日 也 只 有 59027 个 结构 数 
据 。 目 前 由 美国 罗 格 斯 大 学 (Rutgers University) 的 海伦 。 伯 曼 (Helen 
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Berman ) 主持 维护 。 

1976 年 罗伯特 。 兰 里 奇 (Robert Langridge) 发 展 了 第 一 个 在 计算 机 屏 
幕 上 显示 蛋白 质 结构 的 程序 “The nooks and crannies”, 并 在 美国 加 州 大 学 
旧金山 分 校 建 立 了 计算 机 图 像 实验 室 。 

1981 年 ， 珍 尼 ，。 理 查 森 (Jane Richardson) 发 展 出 用 条 带 表 示 蛋 白质 结 
构 的 方法 ， 简 化 了 蛋白 质 结构 展示 的 复杂 性 ， 增 强 了 对 蛋白 质 结构 的 理解 ， 
成 为 标准 的 理 查 森 程 序 。 


2.6 生物 分 子 、 复 合 物 及 病毒 结构 测定 


2.6.1 重要 生物 学 功能 蛋白 的 测定 


1965 年 ， 在 伦敦 工作 的 戴 维 ， 菲利普 斯 (David C. Phillips) 测定 了 第 
一 个 酶 的 原子 分 辨 率 结构 ， 该 溶菌 酶 剪 切 糖 链 。 

1967 年 ， 美 国 科学 家 弗 雷 德 。 理 查 效 (Fred Richards) 、 戴 维 ， 哈 克 尔 
(David Harker) ， 理 查 德 。 迪 克 森 (Richard Dickerson), 、 乔 。 克 劳 特 (Joe 
Kraut) 和 威廉 。 利 普 斯 科 姆 (William Lipscomb) 开始 发 表 解析 的 蛋白 质 
结构 ， 包 括 核糖 核酸 酶 A 和 S (ribonucleases A and S), КЁ (саг- 
boxypeptidase) # № f& Ж c (cytochrome с) ЖЯ Ж Á Ё (chymo- 
trypsin) 。 

1968 Е, KI + # И (David Davies), #8 • 34r (Brian Mat- 
thews) 等 科学 家 开始 解析 抗体 分 子 〈 即 免疫 球 蛋 白 ) 的 三 维 结构 。 

1973 年 ， 罗 伯 托 。 应 扎 克 (Roberto Poljak) 发 现 免疫 球 蛋白 折 乔 ,一 
种 抗体 和 其 他 分 子 结构 中 存在 的 结构 模 体 。 

1981 年 ， 唐 。 威 利 (Don Willey ) 测定 了 流感 病毒 的 红细胞 凝集 素 结 
构 ， 有 助 于 更 深入 了 解 病毒 感染 过 程 。 

1985 #, ЖЕРЕ CAU + MAMI (Deisenhofer J. )， 罗 伯 特 。 休 伯 
(Robert Huber) AMIAR < KK (Hartmut Michel ) 等 测定 了 紫 细菌 
中 光合 作用 反应 中 心 、 第 一 个 膜 蛋白 结构 ,并 因此 三 人 分 享 了 1988 年 度 诺 
贝尔 化 学 奖 。 

1989 年 ， 曼 努 埃 尔 。 纳 维 亚 (Manuel Navia) 和 亚历山大 。 乌 鲁 达 瓦 
(Alexander Wlodawer) 第 一 个 解析 出 人 类 免疫 缺陷 病毒 ， 即 艾滋 病 病 毒 蛋 
白 酶 的 晶体 结构 ， 该 酶 是 病毒 复制 的 关键 之 一 。 该 结构 的 解析 促进 了 治疗 艾 
滋 病 药物 的 研发 ， 对 基于 结构 的 药物 设计 作出 了 杰出 贡献 , 使 艾滋 病 这 个 对 
人 类 几乎 致命 的 疾病 转变 为 慢性 病 。 

1998 年 罗 德 。 麦 金 农 (Rod Mackinnon) 发 表 了 第 一 个 离子 通道 蛋白 的 
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结构 。 离 子 通道 蛋白 是 一 类 和 蛋白质， 能 够 协助 离子 穿越 细胞 膜 ， 行 使 神经 冲 
动 和 其 他 重要 生物 过 程 的 功能 。 这 个 结构 以 及 随后 的 一 系列 结构 极 大 拓宽 了 
我 们 对 神经 科学 的 了 解 ， 促 进 了 离子 通道 蛋白 功能 缺陷 相关 疾病 〈 如 赛 性 纤 
维 化 病 、 心 律 失 常 ) 的 防治 。 麦 金 农 因为 这 个 杰出 贡献 获得 了 2003 EH I 
尔 化 学 奖 。 

同时 , 基因 组 研究 的 进展 促进 了 基因 组 完整 蛋白 质 结 构 的 研究 热情 , 标 
志 着 美国 结构 基因 组 研究 的 启动 。 

1999 年 ， 以 色 列 女 科学 家 阿达 。 约 纳 特 (Ada Yonath) 、 文 卡特 拉 曼 。 
拉 马 克 里 希 南 (Venki Ramakrishnan), #5 • ЖЖ (Тот Steitz) MMH 
E e HR (Harry Noller) 领导 的 研究 组 分 别 测定 了 核糖 体 结构 ,一 个 含 
多 条 RNA 和 和 蛋白质 的 从 RNA 碱 基 序列 翻译 成 蛋白 质 氨 基 酸 序列 的 分 子 机 
器 。 这 是 深入 了 解 生 命 最 基本 过 程 一 一 蛋白 质 合 成 机 制 的 重要 步骤 ， 可 能 对 
新 型 抗生素 的 研发 具有 重要 贡献 。 这 些 科 学 成 就 使 约 纳 特 、 拉 马克 里 希 南 和 
WERFT 2009 年 诺 贝尔 化 学 奖 。 

2001 年 ， 罗 杰 ，。 科 恩 伯 格 (Roger Kornberg) 研究 组 测定 RNA RAAB 
的 三 维 结构 。RNA 聚合 酶 能 够 催化 从 DNA 转录 合成 信息 RNA、 基 因 表 达 
的 关键 步骤 和 控制 点 。 这 项 杰出 成 就 为 科恩 伯 格 赢得 了 2006 年 诺 贝尔 化 
学 奖 。 

2007 年 ， 布 赖 恩 ， 科 比尔 卡 (Brian Kobilka) 研究 组 突破 多 种 技术 挑 
战 ， 解 析出 人 G 蛋白 受 体 (GPCR) 的 第 一 个 三 维 结构 。GPCR 不 仅 控制 我 
们 身体 的 许多 重要 功能 , 还 和 目前 许多 治疗 性 药物 的 作用 机 制 相关 。 这 些 研 
究 成 就 不 仅 能 够 加 快 更 好 疗效 的 新 药 开 发 , 还 能 够 加 深 我 们 对 信号 转 导 途径 
的 了 解 。 

2000 年 9 月 ， 国 立 综合 医学 科学 研究 所 (National Institute of General 
Medical Sciences, NIGMS) 发 起 了 为 期 10 年 的 蛋白 质 结构 计划 (Protein 
Structure Initiative, PSI 或 PSI: Biology), 目标 为 解析 10000 个 蛋白 质 的 
三 维 结构 。 这 些 结构 信息 有 助 于 揭示 蛋白 质 在 健康 和 疾病 中 的 作用 ， 指 导 基 
于 结构 的 新 药 设 计 和 研发 。 该 计划 一 方面 发 展 自动 化 蛋白 质 结晶 技术 ， 同 时 
发 展 更 快速 的 蛋白 质 晶体 结构 解析 技术 和 使 用 更 方便 的 软件 ; 另 一 方面 建设 
这 些 蛋 白质 结构 数据 共享 的 接口 ， 供 全 球 研究 机 构 的 科学 家 共享 使 用 。2005 
年 ， 随 着 10 个 新 的 研究 机 构 的 加 入 ， 该 计划 进入 第 二 阶段 (PSI-2)。 新 建 
立 了 高 通 量 结构 生物 学 (PSI. High Throughput Structural Biology, PSI; 
HTSB), 旨 在 通过 集中 组 织 研究 人 员 在 解决 更 大 级 别 生物 学 难题 方面 进行 
高 通 量 研究 。 项 目 涉及 的 5 个 主要 部 门 分 别 是 高 通 量 结构 检测 中 心 、 膜 蛋白 
结构 测试 中 心 、 高 通 量 活性 结构 生物 学 研究 联合 部 、PSI-SG (PSI Structur- 
al Genomics) 知识 库 和 PSI-SG 资料 档案 库 ， 形 成 PSI 高 通 量 结构 生物 学 网 
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络 核心 。2009 年 2 H 15 Н, NIGMS 宣布 以 促进 运用 已 开发 的 技术 研究 生 
物 医学 重要 研究 难题 为 目标 ， 出 资 促进 生物 学 家 和 高 通 量 结构 检测 中 心 合作 
的 新 方向 。 


2.6.2 病毒 结构 的 测定 


1964 年 ， 又 是 在 英国 剑桥 大 学 ， 阿 龙 。 克 卢 格 (Aaron Klug) 证 明 X 
射线 衍射 测定 蛋白 质 结 构 的 原理 也 可 以 用 于 发 展 晶体 电子 显 微 技 术 ， 可 以 解 
析 更 复杂 的 结构 ， 为 他 赢得 了 1982 年 诺 贝尔 化 学 奖 。 

生命 有 序 ， 死亡 失 序 。 宇 宙 中 自然 发 生化 学 变化 的 趋势 是 变 得 更 加 混乱 
无 序 。 生 命 的 特征 之 一 是 各 层次 结构 的 高 度 有 序 ， 从 蛋白 质 和 核酸 分 子 到 细 
胞 器 ， 到 完整 细胞 ， 到 组 织 器 官 ， 再 到 完整 生物 个 体 。 生 命 有 序 的 化 学 结构 
并 不 依赖 于 神秘 的 力量 , 而 是 建立 在 有 序 的 分 子 结构 和 原子 空间 位 置 之 上 。 
在 物质 能 够 形成 完美 结晶 的 情况 下 ， 用 X 射线 衍射 能 够 测定 分 子 中 所 有 原 
子 的 空间 位 置 。 大 分 子 倾向 于 聚集 ， 生 物 功能 也 常常 与 分 子 聚 集 相 关 ， 如 细 
胞 核 中 染色 体 存在 的 形式 一 一 染色 质 ， 即 是 由 DNA 和 上 千 种 蛋白 质 形成 的 
巨大 分 子 聚 集体 。 病 毒 是 由 核酸 和 蛋白 质 形成 的 较 简 单 的 聚集 体 。 对 病毒 结 
构 的 研究 能 够 为 高 等 生物 遗传 物质 结构 提供 线索 。 

大 分 子 聚合 体 的 研究 难度 很 大 ， 因 此 也 很 少 能 够 制备 晶体 进行 X 射线 
衍射 测定 其 结构 。 克 卢 格 的 科学 贡献 就 在 于 发 展 出 了 测定 生物 系统 中 分 子 聚 
集体 结构 的 方法 。 他 的 技术 是 电子 显微镜 与 衍射 方法 原理 的 天 才 整合 。 电 子 
显微镜 早 就 用 于 对 细胞 亚 结构 进行 成 像 ， 分 辨 力 受到 图 像 缺乏 反差 的 局 限 。 
克 卢 格 发 现 ， 即 使 看 起 来 很 平淡 的 图 像 也 包含 了 大 量 的 结构 信息 ， 使 用 数学 
工具 能 够 挖 据 出 来 。 克 卢 格 还 用 这 种 技术 结合 其 他 结构 化 学 方法 探索 了 病毒 
和 染色 质 的 结构 。 他 对 病毒 的 研究 揭示 了 重要 的 生物 化 学 原理 ， 即 细胞 中 分 
子 的 复杂 聚集 体 是 由 其 各 个 组 成 部 分 自发 形成 的 ! 对 染色 质 的 研究 能 够 揭示 
DNA 上 遗传 信息 阅读 过 程 的 结构 控制 机 理 ; 从 更 长 远 的 观点 来 看 ， 这 些 研 
究 对 阐明 遗传 物质 如 何 失去 对 细胞 分 裂 和 生长 的 控制 ， 即 癌症 的 本 质 ， 具 有 
极其 重要 的 意义 。 

克 卢 格 发 展 出 的 精妙 晶体 电子 显微镜 学 (crystallographic electron mi- 
croscopy) 方法 为 测定 宇宙 中 最 精妙 “ 活 生 物 体 ”的 化 学 结构 提供 了 重要 工 
А. 并 用 于 研究 病毒 、 细 胞 核 中 蛋白 质 和 核酸 形成 的 染色 质 结构 ， 澄 清 了 重 
要 生物 化 学 机 理 。 正 因为 这 些 重大 基础 研究 贡献 ， 他 获得 了 1982 FERN 
尔 化 学 奖 。 

此 后 ， 更 多 病毒 高 分 辩 率 结构 得 到 测定 ， 如 斯 蒂 芬 。 哈 里 森 (Stephen 
Harrison, http: //crystal. harvard. edu/ ) 测定 的 番茄 丛 矮 病毒 (tomato 
bushy stunt virus), 2327 • 罗斯 曼 (Michael Rossmann) 随后 测定 了 人 们 
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更 熟悉 的 病毒 , 如 可 引起 感冒 的 鼻 病 毒 (rhinovirus) 的 结构 。 

番茄 丛 矮 病毒 病 

英文 名 称 : tomato bushy stunt virus, 

i 拉丁 学 名 : Tomato bushy stunt virus， 简 称 ToBSV。 

分 类 地 位 : +ssRNA 目 、 番 茄 从 矮 病毒 科 、 香 茄 丛 矮 病毒 属 。 Н 

i 形态 特征 : 病毒 粒 体 为 球状 ， 正 二 十 面 多 角 体 ， 直 径 30nm， 分 散在 : 

细胞 质 和 液 泡 内 ， 有 晶体 排列 。ToBSV 不 能 被 消化 ， 即 使 通过 人 、 畜 的 ; 

消化 道 也 不 能 改变 其 传染 性 。 体 外 存活 期 为 几 周 。80 一 90 它 加热 210min ! 

可 致死 。 : 
主要 寄主 ;系统 侵 染 番 苛 、 曼 陀 罗 等 ; AARRE, RKE, RA.: 

LERF; LARARE, RH. KAW. AKASH, HA. SRE, H 

Ж. КАХА. кише, ЖЖ. Їй, к, AUR. MEHL MED 


; OO ARAR: МНЕ. dk. RAL ЖЫ, ЖЫ, EAA, RBH 

| 葡萄牙、 突尼斯、 美国 。 

i 危害 部 位 ， 整 株 系统 性 侵 染 ， 产 生 枯 班 。 ! 
BRAK: 必须 在 土壤 积 水 的 条 件 下 借助 汁液 摩 控 、 病 残 体 、 种 子 、; 

花粉 、 土 壤 积 水 等 因子 通过 损伤 的 根 细胞 侵入 。ToBSV 在 河水 中 有 所 发 ; 

} 现 ， 因 此 用 污水 和 淤泥 作为 肥料 时 ， 有 可 能 传播 该 病毒 。 种 子 、 花 粉 也 能 


危害 症状 : 苗 期 染病 5 天 后 初 显 环 状 坏死 斑 ， 叶片 禄 绿 且 迅速 落叶 。j 
; 该 病 在 茎 组 织 发 展 很 快 ， 苗 期 施用 氮肥 过 多 ， 造 成 芭 变 软 ， 在 靠近 地 面 处 ; 
i 出 现 坏死 班 ， 引 起 猴 例 。 系 统 症状 为 幼 叶 卷曲 或 顶部 坏死 ， 由 此 引致 侧 工 | 
; 增生 或 出 现 从 生 。 病 株 下 部 叶片 补 绿 和 变 紫 。 果 实 除 产生 褪 绿 班 以 外 ， 还 | 
| 在 成 熟 果实 上 产生 环 状 或 平行 班 ， AR {ЖЕ HF AE HET 

http: //www. virology. ws/2009/03/06/virus-images-at-viperdb/ 


2.7 同步 辐射 光源 及 发 展 趋势 


同步 辐射 (synchrotron radiation) 是 超 高 真空 环境 中 以 接近 光速 运动 
的 电子 在 运动 方向 改变 时 产生 的 电磁 辐射 ， 其 本 质 与 我 们 日 常 接触 的 可 见 光 
和 XX 射线 一 样 ， 都 是 电磁 辐射 。1947 年 ， 在 同步 加 速 器 上 发 现 这 种 辐射 ， 
因而 被 命名 为 同步 辐射 。1976 fp, Ær- HARE (Keith Hodgson) 等 第 一 
次 证 明 同步 辐射 X 射线 衍射 可 以 测定 蛋白 质 单 晶 的 结构 数据 , 与 传统 ХИ 
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线 衍 射 方 法 相 比 ， 具 有 更 大 的 优势 : 

(D 强度 高 是 一 般 X 射 线 光源 的 104 一 107 倍 ， 因 此 信 噪 比 高 ， 数 据 
采集 效率 高 ， 实 验 时 间 可 大 大 缩短 。 如 用 X 射线 光 机 收集 一 个 晶体 衍射 数 
据 ， 通 常 需要 7 一 15 天 ， 而 利用 同步 辐射 光源 只 需要 十 几 秒 或 几 分 钟 ， 工 作 
效率 提高 了 几 万 倍 。 

(2) 能 量 可 调 性 ”同步 辐射 光 的 高 亮度 除了 缩短 了 数据 收集 时 间 、 提 供 
高 质量 的 数据 外 ， 更 重要 的 是 其 能 量 可 调 性 提供 了 结构 鉴定 所 需 的 相位 信 
息 ， 使 得 结构 鉴定 时 间 从 传统 的 数 月 至 数 年 缩减 到 数 周 甚至 数 天 。 

(3) 高 度 准 直 性 和 偏振 性 ”能够 获得 很 好 的 空间 分 辩 率 和 微 区 内 极 高 的 
光 通 量 ， 可 进行 微 束 扫描 ， 也 可 进行 微量 样品 和 微量 元 素 的 研究 。 使 用 第 三 
代 同 步 光源 ， 蛋 白 晶 体 样品 的 尺寸 可 以 减 小 到 约 20pm。 

(4) 脉冲 性 ”同步 辐射 光 是 由 与 储存 于 环 中 周期 运动 的 电子 束 团 辐射 发 
出 的 ， 具 有 纳 秒 至 微 秒 级 的 时 间 脉 冲 结构 。 利 用 这 种 特性 ， 可 研究 与 时 间 有 
关 的 化 学 反应 、 物 理 激发 过 程 、 生 物 细胞 的 变化 等 。 

ЖУК, 1990 年 ， 韦 恩 ， 韩 椎 柯 森 CWayne Hendrickson) 及 同事 们 发 展 
出 硒 代 甲 硫 氨 酸 的 解析 蛋白 质 晶体 结构 的 方法 ， 这 些 硒 原子 在 结构 测定 中 能 
够 发 挥 空间 标志 的 作用 。 多 波长 反常 衍射 方法 (multiwavelength anomalous 
diffraction, MAD), 适用 于 在 同步 辐射 装置 上 收集 数据 , 是 目前 新 蛋白 结构 
的 主要 测定 方法 。 因 为 波长 反常 散射 法 避免 了 结构 优化 中 模型 误差 的 直接 引 
人 和 重 原子 与 天 然 晶体 之 间 的 同 晶 性 所 产生 的 误差 ， 可 以 方便 快捷 地 解析 出 
晶体 的 结构 。MAD 已 经 成 为 目前 新 型 蛋白 晶体 结构 测定 的 主要 手段 。 

英国 科学 家 J. Walker、 美 国 科 学 家 К. Mackinnon 和 К. Kornberg 通 
过 同步 辐射 研究 生物 分 子 的 结构 与 功能 ， 取 得 了 突破 性 的 成 就 ， 先 后 荣获 
1997 年 度 、2003 年 度 和 2006 年 度 诺 贝尔 化 学 奖 。 

在 2003 年 我 国 出 现 SARS 疫情 后 不 久 ， 我 国 科 学 家 就 利用 同步 辐射 光 
成 功 测 定 了 SARS 病毒 主 蛋 白 酶 的 结构 ， 为 研制 抵御 SARS 病毒 的 药物 提 
供 了 重要 信息 。 

目前 世界 上 公认 ， 同 步 辐射 承担 的 分 析 量 约 占 整个 蛋白 质 结构 的 800% ~ 
85%。 如 果 能 够 再 提高 同步 辐射 光束 线 的 效能 ， 则 结构 基因 体 研究 的 实现 指 
日 可 待 。 

我 国 的 同步 辐射 研究 是 从 20 世纪 70 年 代 末 北京 正 负 电子 对 撞 机 
(BEPC) 的 建造 开始 的 ， 起 初 是 为 高 能 物理 研究 而 设计 的 ， 在 1984 年 的 一 
期 工程 期 间 决定 一 机 两 用 ， 同 时 开展 同步 辐射 的 应 用 ， 这 是 第 一 代 的 同步 辐 
射 装置 ， 称 为 北京 同步 辐射 装置 (BSRF，http:， //www. ihep. ac. cn/) ， 于 
90 年 代 初 建成 。1983 年 中 国 科技 大 学 获 国家 批准 建设 一 台 800MeV 的 低能 
第 二 代 同 步 辐射 源 ， 于 20 世纪 90 年 代 初 建成 ， 称 为 国家 同步 辐射 实验 室 
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(NSRL, http: //www. nsrl. ustc. edu. cn/) 1992 年 开始 为 用 户 服务 。 

上 海 同 步 辐射 光源 (简称 “上 海光 源 ”; 英文 全 名 为 Shanghai Synchro- 
tron Radiation Facility， 缩 写 为 SSRF, http: //ssrf. sinap. ac. сп/) 是 我 国 
迄今 为 止 投资 最 大 的 国家 重大 科技 基础 设施 建设 项 目 之 一 ， 总 投资 约 12 亿 
元 。 上 海光 源 是 一 台 高 性 能 的 中 能 第 三 代 同 步 辐射 光源 ， 能 量 位 居 世 界 第 
四 ， 是 目前 世界 上 性 能 最 好 的 中 能 光源 之 一 。 

在 SSRF 生物 大 分 子 晶体 学 光束 线 站 上 ， 可 以 利用 以 下 多 种 实验 方法 开 
展 生 物 大 分 子 结构 研究 : 多 波长 反常 衍射 方法 (MAD)， 单 波长 反常 衍射 方 
法 (SAD)， 同 晶 置 换 ， 分 子 置换 等 其 他 单 波长 实验 方法 。 

基因 体 的 DNA 序列 决定 了 所 对 应 蛋白 质 内 氨基 酸 的 序列 ， 而 蛋白 质 在 
空间 中 的 折 又 决定 了 蛋白 质 的 功能 ， 所 以 想 了 解 蛋 白质 的 功能 (也 就 是 基因 
体 的 功能 )， 必 须 先 鉴定 出 蛋白 质 的 三 维 空间 分 子 结构 。 结 构 基因 体 学 就 是 
将 一 完整 基因 体 所 对 应 的 所 有 蛋白 质 ， 鉴 定 出 部 分 结构 ， 并 据 以 推测 出 所 有 
对 应 蛋白 质 的 功能 。 由 于 需要 鉴定 结构 的 蛋白 质数 量 是 如 此 庞大 (以 人 类 基 
因 体 为 例 ，25000 个 左右 )， 依 靠 传统 技术 完成 此 研究 的 时 间 似 乎 遥遥 无 
期 ， 因 为 过 去 50 年 以 来 ， 全 世界 以 传统 技术 鉴定 的 蛋白 质 结构 总 数 仅 约 1 
万 个 。 

2000 年 6 月 26 日 ， 美 国 总 统 克 林 顿 、 英 国 首相 布 菜 尔 共 同 宣 布 ， 数 国 
合作 的 “人 类 基因 图 谱 计划 ” 已 完成 ， 接 着 将 进入 后 基因 体 时 代 。 随 即 美国 
国家 卫生 研究 院 (NIH) 所 属 之 国家 大 众 医 药 科 学 研究 所 (NIGMS) 在 7 
月 2 日 宣布 ， 在 美国 境内 成 立 7 个 结构 基因 体 中 心 ， 从 事 大 量 蛋 白质 结构 鉴 
EILE. XE NIH 随即 成 立 六 个 任务 中 心 ， 其 中 五 个 是 同步 辐射 X 射线 设 
施 ， 另 一 个 是 NMR。 基 因 的 解码 意味 着 新 世代 生命 科学 的 来 临 ， 而 结构 生 
物 学 是 开启 此 奥秘 的 钥匙 。 欧 洲 及 日 本 亦 相 继 跟 进 。 蛋 白质 结构 测定 具有 更 
辉煌 的 未 来 ， 发 展 高 通 量 、 高 度 复杂 生物 复合 结构 解析 技术 ， 建 立 预测 和 模 
拟 蛋 白质 三 维 结构 的 计算 机 方法 ， 普 及 各 种 不 同 蛋 白质 结构 的 生物 功能 和 生 
物 医学 作用 的 探索 , 这 些 努 力 和 发 展 无 疑 将 增进 我 们 关于 生物 学 和 健康 领域 
的 知识 ， 有 助 于 研发 出 更 灵敏 的 疾病 检测 和 诊断 方法 , 研发 治疗 疾病 的 更 高 
效 药物 , 提高 人 类 的 生存 品质 。 
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第 3 章 


ЕНЕ 2 Bie 


3.1 蛋白 质 结构 形成 的 本 质 


生物 分 子 之 间 专 一 和 可 再 解 离 地 形成 复合 物 的 能 力 是 生命 活动 的 基础 。 
这 种 专 一 、 可 逆 的 相互 作用 被 称 为 生物 识别 。 每 一 种 蛋白 质 分 子 的 生物 功能 
都 毫 无 例外 地 依赖 于 与 其 他 分 子 直接 的 物理 接触 。 从 基因 的 复制 、 转 录 和 表 
达到 基因 的 调控 ， 从 生物 催化 剂 一 一 酶 的 活性 到 激素 的 功能 ， 以 及 有 机 体 对 
外 源 有 害 物质 〈 如 毒素 、 病 毒 、 细 菌 ) 的 抵御 和 清除 过 程 ， 无 不 依靠 这 种 机 
制 。 细 胞 对 接触 到 的 每 一 种 外 源 物质 进行 辨别 和 结合 :细胞 内 的 每 一 种 物质 
都 首先 被 合成 或 代谢 它 的 酶 识别 和 结合 ， 细 胞 外 的 物质 首先 被 细胞 表面 的 受 
体 结合 ， 然 后 才能 被 吸收 进入 细胞 。 蛋 白质 与 蛋白 质 能 以 非常 专 一 和 紧密 结 
合 的 方式 形成 较 大 的 复合 物 ; 蛋白 质 能 与 核酸 结合 ， 尤 其 在 需要 控制 基因 的 
复制 与 表达 的 情况 下 ; 蛋白 质 能 与 多 糖 ， 特 别 是 细胞 表面 的 多 糖 结合 ;蛋白 
质 能 与 脂 类 结合 ， 常 常 因 此 而 整合 到 细胞 膜 上 。 

蛋白 质 -蛋白 质 相互 作用 几乎 在 细胞 功能 的 每 个 水 平 都 起 着 关键 的 运转 
作用 : 亚 细 胞 器 结构 ， 跨 膜 的 各 种 转运 装置 ， 染 色 质 的 包装 ， 亚 细胞 膜 微 丝 
结构 网 络 ， 肌 肉 的 收缩 和 信号 转 导 ， 以 及 基因 表达 的 调控 等 。 蛋 白质 -蛋白 
质 相 互 作用 异常 会 导致 疾病 ， 如 早老 性 痴呆 和 进行 性 老年 性 痴呆 。 可 以 说 ， 
生物 的 结构 、 生 长 和 繁殖 都 是 以 这 种 生物 相互 作用 为 基础 的 。 普 遍 认为 对 分 
子 相互 作用 基本 机 制 的 详尽 研究 是 分 子 科学 许多 领域 取得 进展 的 重要 基础 。 
例如 ， 在 药物 或 分 子 传感器 的 设计 方面 ， 最 首要 的 目标 是 发 展 一 个 可 以 与 特 
定 靶 分 子 紧密 并 特异 结合 的 化 合 物 分子 。 在 蛋白 质 由 一 级 的 氨基 酸 序列 折 码 
成 二 级 元 件 ， 再 进一步 折 码 成 三 级 结构 过 程 中 , 蛋白 质 分子 内 部 各 基 团 间 的 
相互 作用 势能 启动 相应 的 基 团 提供 多 肽 链 的 摆动 ， 各 化 学 键 的 旋转 找到 相应 
的 空间 位 置 ， 使 整个 蛋白 质 分 子 结构 的 能 量 最 低 ， 从 而 形成 相对 稳定 的 蛋白 
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质 高 级 结构 。 为 了 从 理论 上 研究 和 模拟 蛋白 质 结构 ， 预 测 蛋 白质 分 子 低能 量 
折 全 结构， 需要 理解 分 子 内 部 自由 能 的 全 景 图 谱 。 在 酶 分 子 的 设计 中 ， 其 方 
法 是 创造 出 一 个 可 以 与 过 渡 态 结构 紧密 结合 的 分 子 ， 同 时 能 够 避免 与 底 物 或 
产物 分 子 结合 得 过 度 紧 密 。 这些 例子 都 建立 在 同样 的 概念 框架 上 一 一 原子 和 
分 子 相互 作用 力 和 能 量 知识 的 应 用 。 


3.2 分 子 势能 


蛋白 质 结 构 是 生物 分 子 相互 作用 的 物质 基础 。 通 常用 数学 方式 表示 生物 
分 子 的 相互 作用 ， 但 其 本 质 比 语言 描述 或 数学 公式 复杂 得 多 。 虽 然 这 样 ， 我 
们 仍然 必须 尽 最 大 努力 建立 一 套 与 事实 相 容 的 公式 。 习 惯 上 ， 人 们 把 原子 间 
不 同 种 类 的 相互 作用 称 之 为 力 〈 如 范 德 华 力 ) ， 接 着 又 给 出 一 个 特定 相互 作 
用 的 势能 公式 。 


3.2.1 量子 力学 


量子 力学 是 关于 微观 物质 〈 分 子 、 原 子 、 电 子 等 大 小 在 107 m 数量 级 
左右 的 物体 ) 运动 规律 的 理论 。 近 代 量子 力学 主要 有 四 种 形式 ， 即 : Schro- 
dinger 5 7%, Heisenberg, Born 和 Jordan 的 矩阵 力学 ，Dirac 的 g 数 
理论 和 Feynman 提出 的 途径 积分 方程 。1927 年 ，Heitler 和 London 解析 氢 
分 子 的 量子 力学 方程 ， 标 志 着 量子 力学 原理 开始 应 用 于 化 学 问题 。 量 子 力学 
方法 中 最 通用 的 工具 是 分 子 轨道 理论 (MOT)。 对 于 任意 一 个 由 原子 核 及 电 
子 组 成 的 微粒 体系 ， 若 忽略 自 旋 轨 道 及 其 相关 效应 ， 则 可 用 求解 定 态 的 
Schrodinger 方程 : 


HW(R,r)=EW(R,r) (3. D 


式 中 ， 本 征 元 更 用 来 获取 该 体系 的 定 态 或 散射 态 的 结构 信息 。 这 里 ， 
定 态 的 Schrodinger 方程 即 为 体系 总 能 量 E. 算 子 的 本 征 方程 。 互 算 子 即 
Hamilton WF. Н (Hamiltonian) 运算 符 为 : 


zizje 
A= XE vi ma > EXPE (3.2) 


UB. m 代表 粒子 i 的 质量 ; z; 代表 粒子 所 带 的 电荷 ; 大 代 表 约 化 普 朗 
克 常 数 。 公 式 第 一 项 表示 经 典 的 动力 学 能 量 ; 第 二 项 表示 静电 能 。 所 有 分 
子 ， 包 括 蛋 白质 分 子 的 性 质 都 可 以 用 这 个 公式 表示 (除了 相对 论 引起 的 微小 
效应 )。 然 而 ， 即 使 最 简单 的 Hz 分 子 〈 含 有 两 个 质子 和 一 个 电子 )， 这 个 
方程 式 也 无 法 解答 。 
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3.2.2 Born-Oppenheimer 近似 


对 于 由 多 粒子 组 成 的 分 子 体系 ， 其 定 态 的 Schrodinger 方程 不 易 求解 。 
根据 原子 的 质量 主要 集中 在 原子 核 上 ， 电 子 与 核子 在 质量 上 有 巨大 差异 ， 与 
核子 质量 相 比 ， 电 子 质量 可 以 忽略 。 电 子 运动 比 核 快 得 多 ， 当 电子 运动 时 ， 
可 把 核 看 成 是 固定 的 。Born 和 Oppenheimer (1927) 证 明 分 子 中 电子 和 核子 
的 分 布 可 以 近似 地 分 开 对 待 。 对 于 一 组 核 位 置 固 定 的 系统 ， 电 子 分 布 公式 是 
成 立 的。 可 以 用 每 一 个 原子 核 的 位 置 来 描述 分 子 的 结构 ， 用 Born-Oppen- 
heimer 近似 键 长 或 键 角 表 达 分 子 。 由 Born-Oppenheimer 近似 ， 体 系 的 总 波 
函数 可 以 写 为 : 

HY¥e(R,r)=E(R)YWe(R,r) (3. 3) 

式 中 ，E(R) 为 体系 中 原子 核 坐标 的 函数 ， 通 常 被 称 为 Born-Oppenhei- 
mer 面 或 位 能 面 。 通 常 把 能 够 拟 合 这 个 Born-Oppenheimer 位 能 面 的 表达 式 
称 为 分 子 力 场 。 选 择 合适 的 解析 函数 的 形式 及 确定 参数 是 确定 一 个 分 子 力 场 
的 关键 。 量 子 力学 方法 分 为 从 头 计算 法 和 半 经 验 量 子 力学 方法 ， 常 用 的 半 经 
验 量 子 力学 方法 有 AMI, MNDO 和 РМЗ 等 。 

根据 近似 ， 含 N 个 核子 和 个 电子 的 分 子 的 能 量 可 用 下 列 公式 表示 : 


Eva=Edec+ >) У) ge 


i=lj=1 4reo | Ri—R;| 
式 中 ，R 代表 核 的 位 置 矢量 ; z; 代表 核子 的 电荷 。 公 式 第 一 项 代表 电 
子 参与 的 相互 作用 对 势能 的 贡献 ;第 二 项 是 典型 的 电荷 作用 项 ,这 里 表示 分 
子 中 带电 原子 核 间 的 排斥 。 电 子 波动 方程 和 势能 可 由 下 列 公式 表示 : 
Pae Wri res) = Eas VG r2) (3.5) 
运算 符 Hamiltonian 中 ， 电 子 对 能 量 的 贡献 可 用 下 列 公式 表示 : 


Rf 3 ze 
Bas 27, vi i fe le— R; HÈS 


i=lj=itl 


(3.4) 


i 
(3. 6) 
RH, т 是 电子 的 质量 ; т; 是 电子 的 位 置 矢 量 。 公 式 第 一 项 的 和 相当 
于 电子 的 动力 学 能 量 ; 第 二 项 指 的 是 电子 和 核子 之 间 ， 以 及 和 第 三 个 电子 之 
间 的 相互 作用 。 
n n i 


A я р А2 - ze e 
й У (567? i | —— 
“= D Um p dre | ri Е | PR TEEI 


(3.7) 
理论 上 ， 利 用 量子 化 学 理论 能 处 理 所 有 的 分 子 间 相 互 作用 。 上 述 方程 式 
的 解答 促进 了 量子 化 学 领域 的 诞生 与 发 展 。 量 子 化 学 方法 的 基本 思想 是 找到 
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能 描述 分 子 性 质 ， 在 原子 核 固 定 情况 下 的 一 组 电子 的 分 布 〈 见 Born-Oppen- 
heimer 近似 法 ) 。 应 用 能 量 最 小 化 原理 ， 可 使 分 子 的 几何 结构 最 优化 。 从 头 
计算 量子 化 学 从 第 一 原理 开始 ， 不 需 利 用 外 界 或 实验 数据 ， 人 允许 考虑 特殊 种 
类 , 以 及 更 常规 的 分 子 。 可 以 跟踪 化 学 反应 ， 这 些 方法 在 有 机 化 学 中 是 非常 
有 用 的 。 

假设 可 以 解 出 所 研究 的 系统 中 所 有 原子 核 和 电子 〈 如 酶 、 底 物 和 它们 周 
围 的 水 分 子 环境 ) 的 薛 定 谓 方程 式 。 如 果 能 在 合理 的 短 时 间 内 完成 方程 求 
解 ， 再 与 分 子 动力 学 〈 和 其 他 技术 ) 结合 ， 就 可 能 从 第 一 原理 出 发 ， 相 当 全 
面 地 处 理 一 种 蛋白 质 的 结构 性 质 、 动 力学 和 化 学 反应 性 质 。 不 幸 的 是 ， 应 用 
这 些 方法 解决 蛋白 质 这 样 大 的 分 子 是 不 可 能 的 ， 因 为 计算 能 力 的 局 限 只 能 解 
决 几 十 个 原子 的 分 子 。 甚 至 用 半 经 验 量子 力学 ， 近 似 以 及 实验 数据 ， 也 只 限 
于 考虑 由 几 个 氨基 酸 组 成 的 小 系统 。 然 而 ， 量 子 化 学 能 够 提供 非常 重要 的 参 
量 ， 用 于 分 子 力学 法 和 蛋白 质 中 的 化 学 反应 研究 。 

对 于 最 简单 的 分 子 ， 克 服 一 定 的 困难 也 能 够 找 出 精确 的 数学 答案 。 对 于 
比较 复杂 的 系统 ， 有 需要 采用 不 同 的 途径 。 经 常 使 用 的 LCAO 方法 ， 即 把 
一 个 试验 性 分 子 轨道 用 整个 分 子 中 每 个 原子 轨道 的 线性 组 合 表示 : 

Vuo= У) Cif; (3. 8) 
г 


差异 原理 (variation principle) 可 用 于 找 出 系数 的 数值 。 差 异 原理 规定 
了 计算 出 的 Hamiltonian 函数 的 期 望 值 必须 高 于 基础 能 态 的 值 : 
je Hodr 
er par 

换 句 话说 ， 如 果 我 们 有 某 个 分 子 的 试 算 波动 方程 ， 并 作 了 一 些 降低 能 量 
的 变化 ， 此 时 ,新 方程 比 真正 的 波动 方程 能 更 好 地 近似 于 系统 。 因 此 ， 可 以 
通过 调整 系数 值 获得 “EC(Wmxo)〉 的 最 小 值 ， 从 而 找 出 系数 的 最 佳 值 。 

描述 电子 -电子 排斥 的 Hamiltonian 最 后 项 使 情况 进一步 复杂 化 。 如 果 
没有 这 一 项 ， 有 可 能 用 变量 分 离 方法 独立 解决 每 一 个 电子 的 薛 定 兽 方程 ， 但 
是 ， 当 包括 该 项 时 ， 就 不 可 能 了 。 为 避免 这 个 问题 ，Hartree 和 Fock 提出 
并 发 展 了 标准 近似 法 。 假 设 由 于 核子 和 其 他 电子 的 存在 ， 每 一 个 电子 都 在 平 
均 场 中 运动 ， 那么， 即 可 猜测 得 到 这 个 分 子 的 最 初 波动 方程 。 在 LCAO 方 
法 中 ， 选 择 出 一 系列 被 称 为 基础 组 的 固定 化 phi (至 少 必须 代表 每 一 个 原子 
被 占据 的 每 一 个 原子 轨道 );， 最 初 猜测 是 一 套 系数 (Ck ) 一 一 (这 必须 符合 
Pauli 原理 ， 并 且 是 反对 称 的 )。 在 固定 其 他 原子 轨道 的 情况 下 ， 依 次 找 出 每 
一 个 原子 轨道 的 最 佳 系 数 。 继 续 这 个 过 程 ， 直 到 整个 循环 中 所 有 的 系数 保持 
TRUE. 并 且 自 身 相 容 为 止 。 此 方法 被 称 为 自身 相 容 场 法 (self-consistent 


(E(p))= 


(3.9) 
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field, SCF), 

这 种 方法 通常 被 称 为 从 头 模仿 法 ， 它 最 大 的 优点 是 : 处 理 一 个 分 子 时 ， 
不 需要 利用 任何 经 验 参 数 。 如 果 基 础 数据 的 大 小 合理 ， 并 可 降低 SCF 近似 
法 引起 的 误差 ， 通 过 在 计算 中 考虑 电子 相关 性 ， 计 算 的 准确 性 还 是 比较 合理 
的 。 用 能 量 最 小 化 方法 计算 一 系列 核 位置 的 能 量 (变化 Ri 使 势能 最 小 ), HE 
型 的 几何 性 质 能 够 得 到 改善 。 它 的 主要 问题 是 计算 费用 ， 随 4. 5 的 n 次 方 升 
高 ， 其 中 是 用 于 计算 的 基础 方程 的 数目 。 因 此 ， 提 高 小 分 子 模拟 和 大 分 子 
结构 的 精度 是 非常 昂贵 的 。 实 际 计算 的 最 高 范围 是 几 十 个 原子 。 半 经 验 量子 
模拟 法 例如 AMD 在 SCF 计算 法 中 同时 利用 了 近似 和 经 验 数 据 ， 能 够 扩 
大 计算 的 范围 。 但 是 这 种 方法 仍然 太 贵 ， 甚 至 无 法 计算 最 小 的 蛋白 质 。 

虽然 计算 费用 昂贵 ， 量 子 力学 方法 在 蛋白 质 模拟 研究 中 仍然 非常 有 用 ， 
能 够 计算 分 子 力学 的 参数 ， 能 够 处 理 原 子 的 部 分 电荷 ， 修 正 分 子 在 从 头 计 算 
过 程 中 的 部 分 静电 势 。Bash 等 (1987) 采用 半 经 验 量 子 力学 方法 来 处 理 系 统 
中 一 小 部 分 的 原子 KHA 20 个 非 氢 原 子 )， 然 后 用 Warshel 和 Levitt 修改 过 
的 分 子 力学 方法 来 处 理 剩 下 的 原子 。 这 种 方法 可 以 处 理 溶液 中 的 化 学 反应 ， 
如 磷酸 丙 糖 异 构 酶 的 酶 促 反应 。Warshel 等 大 量 使 用 了 一 种 化 学 键 量子 力学 
方法 与 分 子 力学 方法 的 联合 程序 。 另 一 种 方法 是 以 量子 动力 学 的 Feynman 
路 径 积 分 公式 为 基础 的 , 已 经 用 于 常规 分 子 力学 力 场 ， 量 子 模拟 亚 铁 细胞 色 
素 c， 模 拟 硬 球 流体 和 晶体 中 过 量 的 电子 。 

模拟 可 以 只 在 蛋白 质 的 一 小 部 分 上 进行 。 这 允许 处 理 不 能 用 分 子 力学 势 
能 函数 解释 的 过 程 , 例如 ， 化 学 反应 或 者 光谱 迁移 。Arad 等 用 AMI (一 种 
半 经 验 量 子 力学 程序 ) 模拟 了 木瓜 蛋白 酶 反应 机 制 中 硫 攻 击 的 反应 途径 。 根 
据 分 子 力 学 势能 方法 对 木瓜 蛋白 酶 能 量 最 小 化 ,从 得 到 的 最 低能 量 构象 计 
算 ， 该 系统 中 酶 活 位 点 周围 有 111 SRF. Penfield 等 用 氨 代 替 组 氨 酸 ， 甲 
基 硫 产 酸 盐 代 替 半 胱 氨 酸 ， 二 甲 基 硫 醚 代替 甲 硫 氨 酸 ，7 个 非 氢 原子 对 金属 
配 位 点 进行 近似 ; 根据 从 头 计算 Cab initio) 方法 检测 了 质 体 蓝 素 中 蓝 色 铜 
元 素 的 电子 结构 以 及 铜 元 素 光谱 的 超 精细 线 分 裂 。Bajorath 等 证 明了 酶 (二 
氢 叶 酸 还 原 酶 ) 如 何 干扰 结合 中 底 物 (叶酸 ) 的 电子 分 布 。 一 种 交互 从 头 计 
算 电子 结构 技术 (局 域 密度 功能 理论 ，local density functional theory) 能 在 
库仑 场 中 以 量子 力学 方式 处 理 原子 数 高 达 49 个 的 底 物 。 这 个 库仑 场 是 由 酶 、 
辅酶 和 溶剂 的 每 一 个 原子 所 带 的 部 分 电荷 形成 。 


3.2.3 势能 函数 


已 经 简要 回顾 了 和 蛋白质 相 互 作 用 中 几 种 重要 的 相互 作用 形式 ， 并 且 能 
用 简单 合理 的 数学 形式 表达 。 这 些 相互 作用 力 组 合 在 一 起 形成 势能 函数 
公式 。 
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PEF(R)= У) Ky{b(R)—beq}? + У) KotOR) —0.,)2 + 


bonds angles 


УЗ F¢(1-+cos{n(R)—7]} + 
dihedrals 


(3. 10) 


Ay By 9:9} 
[сёз К; apy | 


此 公式 可 用 来 计算 一 一 个 具体 蛋白 质 任何 构象 的 势能 [PEF(R)] fü. fj 
象 可 用 坐标 向 量 (R 表示 。 称 其 为 势能 函数 ， 是 因为 它 不 包含 原子 运动 的 
能 量 。 可 以 用 分 子 动力 学 方法 计算 这 种 能 量 。 这 个 方程 的 目的 是 合理 计算 两 
个 不 同 构象 之 间 微 观 态 能 量 的 差别 。 这 个 能 量 的 绝对 值 没有 任何 意义 〈 肯 定 
不 是 结构 的 自由 能 )。 上 述 方程 式 也 不 适用 于 涉及 化 学 键 改变 的 任何 过 程 ， 
如 模拟 酶 活 位 点 的 化 学 反应 , 也 不 能 评价 蛋白 质 是 否 采 用 某 种 折合 形式 。 用 
上 述 方程 式 计算 蛋白 质 的 势能 时 ,还 需要 用 到 大 量 的 参数 平衡 键 长 ，beq; 
键 伸缩 常数 ，Kb) 。 找 出 这 些 参数 的 过 程 是 艰苦 费力 的 ， 共 同 使 用 的 势能 方 
程 只 有 大 约 四 个 (CHARMm，AMBER，GROMOS 和 ECEPP) 。 

虽然 用 势能 方程 (3.100. 计算 出 的 结果 只 是 近似 值 ， 它 最 大 的 优点 是 计算 
费用 低 。 这 就 允许 表现 真实 环境 ， 如 直接 模拟 蛋白 周围 大 量 的 水 分 子 , 也 允许 计 
算 同 一 分 子 不 同 构象 的 势能 值 , 促进 了 分 子 动力 学 方法 的 使 用 ， 如 探测 一 个 系统 
中 的 热 运 动 。 这 些 与 量子 化 学 方法 形成 鲜明 的 对 比 。 用 量子 化 学 方法 处 理 小 系 
统 也 非常 昂贵 ,以 至 于 只 能 计算 有 限 的 次 数 ， 但 可 以 获得 非常 准确 的 能 量 值 。 

采用 量子 力学 方法 的 分 子 模拟 软件 有 Cerius2 INSIGHT П (MSD, 
HyperChem (Hypercube) 和 SYBYL (Tripods) 。 应 该 记 住 ， 许 多 的 模拟 软 
件 都 带 有 几 种 数学 方法 可 供 选择 使 用 ， 例如，Mac/PC/UNIX SPARTAN 
(Wave function), SYBYL (Tripods) 和 INSIGHT П (MSI) 结合 使 用 分 
子 力学 、 量 子 力学 和 GO 分 子 动力 学 。 


3.3 分 子 内 基 团 识别 的 要 素 


3.3.1 分 子 之 间 相互 作用 


真空 中 两 个 分 子 工 和 了 J 卫 ， 位 于 结合 面 上 工分 子 的 所 有 原子 和 分 子 J 上 所 
有 原子 相互 作用 时 ， 两 个 分 子 相互 作用 的 总 能 量 EE， 可 以 用 Clementi 公式 
计算 : 


了 ab ab b 
АР BÈ С?хах 
Е xx [s RS RN = а) (3.11) 


式 中 ， 总 和 指 了 中 的 所 有 原子 和 1 中 的 所 有 原子 ， ry RF ij 之 间 
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的 距离 ;， 常数 A，B，C 是 原子 i 和 j 相互 作用 的 特征 常数 ， 取 决 于 i 和 j 的 
种 类 ; 上 标 a 标示 原子 i 和 j 的 种 类 ; 上 标 b 描述 相互 作用 的 原子 类 别 ( 如 
氧 原子 0， 可 以 归 为 OH、CO、CHO、COOH 等 任何 一 类 ) ; 原子 i 和 j 
的 电荷 用 gq; 和 9i 表示 。 

公式 第 一 项 表示 伦敦 吸引 力 ; 第 二 项 表示 原子 核 之 间 的 排斥 力 ; 第 一 和 
第 二 项 的 和 描述 几何 互补 性 质 ; 第 三 项 描述 库仑 静电 作用 。Clementi 方程 
描述 的 是 几何 和 构象 固定 不 变 的 情况 下 两 个 分 子 的 相互 作用 。 分 子 项 代表 原 
子 对 的 相互 作用 ， 只 与 原子 的 种 类 相关 ; 而 分 母 反映 的 是 原子 的 位 置 ， 与 原 
子 的 性 质 无 关 。 所 有 的 原子 间 力 都 能 够 归结 为 在 原子 核电 场 中 运动 的 轨道 电 
子 的 相互 作用 或 轨道 重组 。 因 此 ， 常 常 需要 用 量子 理论 进行 分 析 ， 而 用 传统 
的 力学 则 显得 力不从心 。 生 物 识别 研究 中 只 考虑 距离 大 于 化 学 键 ， 小 于 
0. 35nm 之 间 的 相互 作用 。 尽 管 有 一 些 经 验 处 理 方法 ， 由 于 计算 机 计算 能 力 
的 限制 ， 还 不 能 用 量子 理论 处 理 所 有 的 相互 作用 问题 。 


3.3.2 静电 相互 作用 


带电 原子 的 相互 作用 可 以 用 库仑 定律 计算 , 但 需要 考 虚 到 在 一 般 情况 
下 ， 电 荷 是 离 域 化 的 ， 并 表现 出 永久 偶 极 〈 或 多 极 )。 在 两 种 情况 下 ， 静 电 
能 量 可 以 用 部 分 电荷 的 概念 或 与 化 学 键 中 心 相关 的 非 整数 电荷 计算 ， 从 而 重 
现 分 子 的 静电 场 。 

静电 势 代表 所 有 永久 和 瞬时 电荷 分 布 ， 而 与 氢 键 形成 相关 的 电荷 需要 单 
独处 理 。 这 类 相互 作用 本 质 上 是 以 下 式 表 示 的 每 对 电荷 的 库仑 相互 作用 ， 


332 X qi Xqz 
eXriz 


式 中 ， 相 互 作用 的 电荷 用 a 和 qo 表示 ; 电荷 间 的 距离 用 то ве, АӨ; e 
表示 两 个 电荷 间 介质 的 介 电 常 数 。 在 水 中 ,相互 作 用 被 水 巨大 的 介 电 常数 大 
大 减弱 ， 如 : 真空 中 两 个 正 电荷 间 的 氮 原 子 间 的 相互 排斥 能 量 为 30k] 
(130kcal)， 在 水 中 减弱 到 33kJ， 减 弱 倍数 为 16 (Fersht，1985)。 蛋 白质 分 子 
中 的 介 电 常 数 取 决 于 电荷 对 的 具体 位 置 ， 如 溶菌 酶 活性 位 点 的 有 效 介 电 常 数 
大 约 为 5 (Warshel & Levitt，1976) 。 这 类 相互 作用 的 能 量 在 一 3 一 一 4kcal/mol 
之 间 ， 相 当 于 在 相应 pH 条 件 下 氨基 和 羧基 之 间 的 相互 作用 大 小 。 

按照 相互 作用 的 能 量 随 距 离 减 小 的 规律 ， 电 荷 相互 作用 可 以 细 分 为 三 
类 : @ 离 子 对 间 的 相互 作用 随 距 离 的 倒数 (1/r) 减 小 ; @ 离 子 与 电荷 偶 极 
子 间 的 相互 作用 随 距离 的 4 次 方 的 倒数 1/00. 减 小 ; 回电 荷 偶 极 子 间 的 相 
互 作用 随 距 离 的 6 次 方 的 倒数 (1/75) 减 小 。 


E(kcal/mol) = (3.12) 


Ф 1A=0.1nm 
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3.3.3 A 


氢 键 在 配 体 与 受 体 、 底 物 与 酶 、 蛋 白质 与 DNA 相互 作用 ， 以 及 蛋白 质 
分 子 多 肽 链 的 折 释 过 程 中 都 具有 重要 作用 。 

由 于 氢 键 在 生物 系统 中 具有 非常 重要 的 作用 , 它 也 许 是 研究 得 最 多 的 非 
键 相互 作用 。 然 而 ， 尽 管 收集 到 关于 氢 键 的 事实 数据 不 少 ， 也 利用 了 各 种 实 
验 手段 ， 包 括 测 热 法 、 光 谱 学 、 核 磁 共 振 (NMR), X 射线 和 中 子 衍射 , 仍 
然 没 有 可 以 普遍 适用 的 氢 键 模型 ， 形 成 氢 键 时 能 量 的 变化 也 是 争论 的 焦点 。 
氢 键 可 以 在 质子 供 体 基 团 AH [其 中 A 是 电 负 性 原子 (O, N, S, F, C 
和 Во] 和 质子 受 体 基 团 B 之 间 形 成 。 受 体 基 团 B 具有 一 个 孤 电子 对 或 不 饱 
和 键 的 r- 电 子 轨 道 ， 如 氨基 与 芳香 基 团 间 的 氢 键 (Waksman 4$, 1992) , A 
键 具有 强烈 的 方向 性 ， 只 允许 A-H-B 的 角度 在 一 定 范围 内 变化 。 

因为 所 原子 上 的 部 分 电荷 〈 约 0. 28 电子 电荷 ) 是 氨 键 相互 作用 的 必要 
条 件 ， 非 键 作 用 、 色 散 和 排斥 作用 的 分 类 也 以 酰胺 氮 原 子 为 条 件 。 这 个 模型 
得 到 Allen ( 1975) 提出 的 以 从 头 计算 分 子 轨道 波动 方程 为 基础 的 量子 力学 
模型 的 验证 。 从 蛋白 质 工程 突变 实验 结果 推测 (Fersht, 1987; Shirley $, 
1992) 出 几 种 中 性 电荷 一 一 中 性 电荷 氢 键 对 自由 能 (Съ) 的 贡献 为 一 0. 48 一 
一 1. 9kcal/mol (—2— —8kJ/moD, 8 C 一 H…O —C 存在 于 晶体 结构 中 。 
这 种 与 电子 云 形成 的 氢 键 的 自由 能 (Ga) 大 约 为 一 0.24 一 一 0.48kcal/mol 
(一 1 一 一 2kJ/mol ) 。 


3.3.4 溶剂 或 疏水 相互 作用 


没有 水 ， 生 命 便 不 可 能 形成 。 在 生物 化 学 反应 中 ， 水 不 仅 是 一 种 良好 的 
溶剂 ， 也 是 在 各 种 生化 反应 中 提供 H+ 和 OH” 的 主要 源泉 。 同 时 ， 水 还 是 
生物 分 子 表现 生理 活性 的 唯一 天 然 环 境 。 水 的 结构 特点 及 对 生物 分 子 作用 力 
的 影响 可 归纳 如 下 : 

CL) 水 分 子 由 一 个 氧 原 子 和 两 个 氢 原 子 组 成 ， 由 于 分 子 不 对 称 的 空间 构 
型 ， 其 中 氧 原子 具有 负极 作用 ， 而 相 邻 的 两 个 氢 原 子 则 形成 偶 极 分 子 中 的 正 
极 。 两 个 氧 原子核 与 氧 原子 核 连 线 之 间 形 成 的 夹 角 约 为 105"， 是 一 个 高 度 
极 化 的 极 性 分 子 ， 具 有 很 高 的 介 电 常数 。 

COD 由 于 偶 极 分 子 中 力 场 的 作用 ， 水 分 子 彼此 吸引 而 缔 合 ， 很 少 单独 存 
在 。 每 个 水 分 子 通过 氨 键 可 与 另外 4 个 水 分 子 配 价 ， 形 成 四 面体 “冰晶 ”的 
结构 ， 随 着 周围 条 件 的 变化 ， 结 构 中 的 毛 键 的 能 力 减弱 , 水 分 子 还 可 以 减弱 
离子 键 相互 作用 ， 而 增强 非 极 性 疏水 键 的 相互 作用 。 

O 通过 氢 键 的 缔 合 作用 ， 许 多 生物 分 子 如 多 糖 、 淀 粉 、 蛋 白质 、 核 酸 
等 分 子 中 的 羟基 或 氧 、 氢 等 原子 都 可 以 通过 氢 键 与 水 结合 ， 从 而 具有 巨大 的 
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水 合 或 称 “ 水 化 ”能 力 。 

通过 上 述 关 于 一 些 生物 分 子 中 的 结合 力 及 分 子 间 的 作用 力 的 简单 介绍 ， 
可 以 看 到 生物 体系 中 分 子 结构 及 分 子 之 间 联 系 的 作用 力 十 分 复杂 。 作 为 一 个 
生物 分 子 ， 其 基本 骨架 的 各 原子 及 基 团 之 间 都 是 共 价 结合 的 ， 整 个 分 子 的 一 
级 结构 是 比较 稳定 的 。 但 分 子 与 分 子 间 的 连接 主要 通过 一 些 非 共 价 键 如 氢 
键 、 电 荷 -电荷 相互 作用 、 范 德 华 相互 作用 和 朴 水 作用 所 维系 ， 其 相互 作用 
的 能 量 较 弱 ， 而 且 性 质 差 别 较 大 。 

朴 水 键 的 概念 出 现在 许多 与 溶剂 作用 相关 的 文章 中 ， 用 于 粗略 描述 存在 
于 原子 间 、 能 够 精确 定义 和 可 用 方程 描述 的 相互 作用 。 建 立 理论 模型 的 困难 
在 于 这 个 相互 作用 实质 上 与 箭 的 关系 比 与 烩 的 关系 更 密切 ， 并 且 缺 乏 描述 多 
个 水 分 子 行为 的 模型 。 

毫 无 疑问 ， 一 对 蛋白 质 分 子 从 相互 独立 到 结合 在 一 起 经 历 了 烩 增加 和 和 
减少 的 过 程 。 从 结合 表面 排斥 开 的 溶剂 分 子 经 历 了 形成 更 多 氢 键 更 混乱 的 过 
TR. Mani eso Ж AR. 因此， 整个 过 程 的 自由 能 可 表示 为 : 

G= (Hprotein + Нм) — T ( Sprotein + Ssolvent ) (3.13) 

Nethethy & Scheraga 估计 各 种 氨基 酸 侧 链 从 水 中 转移 到 非 极 性 环境 中 
的 Sprotein 十 Ssokent 的 数值 在 十 9 一 十 16cal/(mol。C)， 取 决 于 侧 链 的 体积 和 
性 质 。Chothia & Janin 更 倾向 于 证 明 小 溶剂 (水 分 子 获得 平移 和 旋转 自 
Hi HERE IK RN. S 等 于 十 70cal/(mol。 '‘C)， 蛋 白质 侧 链 失去 内 部 旋转 
自由 度 时 失去 炉 值 AS。 两 种 模型 预测 的 AG 都 大 大 低 于 零 时 ， 两 个 分 子 才 
倾向 于 结合 。 

习惯 上 ， 测 量 朴 水 作用 的 方式 有 两 种 : 

第 一 种 为 微观 方式 ， 基 于 碳 氢化 合 物 从 溶质 表面 转移 到 水 中 的 能 量 ; 处 
于 水 中 的 特定 碳 氢 链 ，Gibson & Scheraga 以 及 Forsythe & Hopfinger 都 认 
为 ， 水 化 层 中 的 每 一 个 水 分 子 被 代替 ， 其 自由 能 变化 为 一 130cal/mol。 对 氢 
原子 来 说 ，G 为 十 300cal/mol; 而 对 极 性 基 团 ,如 痰 基 氧 原子 、 酰 氨基 氮 原 
子 ，G 为 600 一 4500cal/mol。Chothia 提出 ， 水 分 子 从 蛋白 质 溶剂 可 及 表面 
被 去 除 时 的 自由 能 数值 为 一 25cal/A: 。 每 一 个 水 分 子 的 横 截 面积 大 约 为 
6A2, 因此 每 个 水 分 子 的 自由 能 变化 相当 于 G=—150cal/mol, 尽管 Chothia 
模型 可 能 是 一 种 极端 情况 ， 早 期 溶剂 可 及 表面 的 计算 可 能 受到 质疑 ， 以 上 三 
种 处 理 朴 水 键 的 方法 所 得 到 的 自由 能 大 体 上 一 致 。 利 用 溶质 分 子 的 可 及 表面 
计算 得 到 的 疏水 效果 的 数值 在 20~30cal/Cmol + A?)。 正确 评估 摩尔 转移 自 
由 能 G， 可 以 用 Flory 和 Huggins 的 混合 理论 计算 , ARH: 

AG- —RT(IKc-[*— v2 ]) 3.14) 

RF, K 是 分 配 常数 ， 用 体积 分 数 表示 ; У. 是 溶质 的 摩尔 体积 ; Va 
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和 V 是 溶剂 的 摩尔 体积 。 这 个 公式 考虑 到 了 溶质 和 溶剂 分 子 大 小 的 差别 。 
用 公式 (3. 14) 重新 计算 玻 水 作用 得 到 的 数值 为 47cal/ (mol* A?)。 通过 拟 合 
碳 氨 化 合 物 的 分 子 面积 与 从 纯 液 体 到 水 溶液 中 的 转移 自由 能 [69. 2cal/ (mol • 
А)), Tunon 等 取得 了 与 用 碳 所 化合物 -水 界面 张力 方法 一 致 的 结果 
[69. 2cal/(mol • A?)], 

第 二 种 ， 或 称 之 为 相互 作用 的 宏观 处 理 方式 ， 来 源 于 碳 氢化 合 物 与 水 界 
面 的 张力 。 已 经 总 结 的 几 种 经 验方 法 整合 了 分 子 疏 水 性 、 溶 解 性 、 溶 剂 分 配 
系数 等 实验 数据 。Gibson & Scheraga, Hopfinger 以 及 Forsythe 和 Hopfinger K 
用 了 水 化 壳 模 型 提供 溶剂 自由 能 一 项 。 溶 剂 自由 能 是 分 子 构象 的 函数 ， 而 分 
子 构象 是 通过 计算 容纳 溶质 分 子 构象 变化 需要 从 第 一 水 化 过 去 除 溶剂 分 子 的 
数目 ， 最 大 可 为 整个 水 化 壳 中 所 有 溶质 分 子 的 数目 。 对 于 每 一 个 被 替代 的 溶 
剂 分 子 来 说 ， 自 由 能 贡献 需要 考虑 到 溶剂 和 溶质 中 原子 的 性 质 。 以 类 似 的 方 
式 ，Chothia 利用 Nozaki 和 Tanford 从 氨基 酸 在 有 机 溶剂 中 的 溶解 度 计 算出 的 
Bi 7k HERE LA Richards 和 Lee 估计 的 可 及 表面 数据 (Lee & Richards, 1971) 
得 到 了 从 蛋白 质 分 子 表面 每 移 去 1A2 的 溶剂 分 子 引起 的 自由 能 变化 。 另 一 种 方 
法 是 用 Fersht 关于 许多 酶 的 数据 ， 如 CHs 、CHzCHs 和 CH(CHs〉 的 结合 
数据 ， 每 个 亚 甲 基 减 少 8kJ/mol。 因为 当 一 个 亚 甲 基 充填 酶 结构 中 的 “ 孔 ”( 不 
同 于 开放 的 结合 部 位 ) 时 ， 得 到 结合 能 的 变化 ， 则 每 个 亚 甲 基 的 朴 水 效果 为 
一 2. 5kJ/mol。 当 使 用 这 个 数值 时 ， 一 个 甲 基 可 以 算 作 3 个 CH ЖИ]. 


3.3.5 伦敦 类 型 的 相互 作用 


非 极 性 分 子 没有 永久 的 多 极 性 ， 但 当 与 极 性 分 子 靠近 时 表现 出 诱导 的 或 
瞬时 多 极 性 效果 。 这 些 邻 近 (永久 或 瞬时 ) 多 极 子 或 轨道 电子 运动 的 概率 性 
质 产生 的 扰动 效应 能 改变 分 子 中 电子 的 分 布 。 这 些 效果 的 强度 取决 于 原子 的 
极 性 常数 ， 尽 管 每 个 原子 看 似 很 小 〈 与 热 运动 相同 )， 但 由 于 数目 庞大 ， 对 
分 子 内 和 分 子 间 的 能 量 贡献 是 相当 可 观 的。 理论 上 看 ,两 个 中 性 原子 靠近 
时 ， 一 个 原子 中 电子 的 任何 扰动 会 诱导 另 一 个 原子 中 电荷 的 互补 性 变化 ; 这 
种 扰动 引起 的 偶 极 子 或 多 极 子 的 相互 作用 能 量 是 负数 ， 即 相互 吸引 。 这 种 瞬 
时 偶 极 子 诱导 现象 首先 由 London (1937) 提出 , 因此 称 为 伦敦 色散 力 
(London dispersion forces)。 如 上 所 述 ， 这 种 量子 理论 预测 的 分 散 力 起 源 于 
电子 分 布 的 瞬时 扰动 ， 即 使 在 非 极 性 分 子 间 也 存在 着 这 种 色散 力 ， 频 率 在 光 
波 范围 内 (101° Hz) 。 实 际 上 ， 相 互 作用 是 在 瞬时 偶 极 子 和 诱导 偶 极 子 之 间 
发 生 的 。 因 此 ， 色 散 力 在 形式 上 与 诱导 作用 类 似 , 但 强度 取决 于 相互 作用 的 
基 团 的 极 化 能 力 。 

瞬时 偶 极 子 与 诱导 偶 极 子 之 间 的 相互 作用 在 形式 上 与 诱导 相互 作用 非常 
类 似 , 但 相互 作用 的 大 小 由 相互 作用 的 两 个 基 团 的 极 化 能 力 决 定 。 这 种 相互 
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作用 起 源 于 量子 力学 性 质 , 因此 即使 对 于 简单 的 分 子 ， 也 需要 量子 表达 方式 
才能 与 试验 数据 一 致 。Slater 和 Kirkwood (1931) 提出 的 公式 如 下 : 
3xXe хау? » aaz 
2%, (а /nm) + az /п;)!? 
式 中 ，eo 代 表 电荷 ! ae 为 波 尔 直径 ;riz 是 距离 ，A; а Ma 是 基 团 的 
极 化 常数 ，A3; m Am 是 相互 作用 体系 的 外 层 电子 数 ，e 是 有 效 介 电 常数 。 
London (1937) 对 这 种 作用 进行 了 更 精确 的 处 理 : 


о=—3х В ута 


4*hth e, 
xb. h D 是 相互 作用 基 团 的 离子 化 能 ，kcal/mol。 
应 该 认识 到 相互 作用 的 物理 基础 是 以 光 的 频率 进行 波动 的 结果 ， 两 个 公 
式 需 要 用 高 频 极限 下 的 介 电 常 数 。e 的 数值 相当 于 溶剂 折射 率 的 平方 ， 即 使 
在 像 水 这 样 的 极 性 溶剂 中 也 是 这 样 。 与 此 形成 鲜明 对 比 的 是 在 静电 相互 作用 
中 ,的 数值 相当 于 零 频 率 下 的 介 电 常数 。 


3.3.6 原子 核 在 超 短 距离 时 的 排斥 作用 


其 他 非 键 作用 是 在 短 距离 时 产生 的 排斥 作用 (ris 二 2~~3A)， 而 且 随 rie 
趋 近 于 ОА 而 趋 于 无 穷 大 , 因此 与 原子 和 分 子 具有 空间 填充 性 质 一 致 。 原子 
间距 离 对 核 排 斥 作 用 的 影响 非常 强烈 , 但 对 于 函数 的 形式 还 没有 达成 一 致 。 
描述 核 排 斥 作用 的 方程 之 一 是 Lennard-Jones 方程 : 


w= (3.17) 
式 中 ，riz 是 一 对 原子 之 间 的 距离 ; B 是 一 个 只 与 原子 对 相关 的 常数 。 从 


这 个 方程 式 可 以 明确 看 出 , 分 子 识别 过 程 中 任何 不 互补 的 表面 都 会 引起 巨大 
的 排斥 ,并 进一步 造成 分 子 复 合 物 的 解 离 。 


(3.15) 


(3. 16) 


3.4 识别 的 专 一 性 


在 分 子 结合 的 过 程 中 ， 通 常 是 溶液 中 的 两 个 分 子 相互 靠近 形成 某 些 构 型 
的 复合 物 〈 新 分 子 )。 参 加 反应 的 分 子 通 常 被 称 为 配 基 和 受 体 。 实 际 上 ， 从 
技术 的 观点 看 ， 怎 样 命名 并 不 重要 。 总 之 ， 由 于 反应 物 和 复合 物 的 构象 自由 
度 ， 每 一 对 反应 物 可 能 会 以 多 种 构象 相互 结合 ， 形 成 多 种 复合 物 分 子 或 者 同 
一 种 复合 物 的 多 种 构象 。 

人 们 对 分 子 科学 研究 的 兴趣 大 多 集中 在 分 子 或 者 分 子 片段 的 结合 作用 方 
面 。 伴 随 着 结合 过 程 产生 结合 自由 能 。 由 于 分 子 的 相互 结合 ， 溶 液 中 总 自由 
能 发 生变 化 , 与 此 同时 复合 分 子 的 浓度 也 发 生变 化 。 自 由 能 的 变化 量 决定 了 
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结合 的 分 子 复合 物 在 平衡 时 的 比例 。 在 很 多 情况 下 ， 总 的 结合 自由 能 可 被 分 
解 成 独立 的 静电 和 非 静电 作用 ; 静电 结合 对 自由 能 的 作用 完全 是 由 于 反应 物 
所 带 的 静电 荷 引 起 的 。 天 然 分 子 结合 反应 的 表面 驱动 力 大 部 分 是 非 静电 作 
用 ， 包 括 所 谓 的 朴 水 作用 。 对 朴 水 作用 有 利于 分 子 结合 的 解释 之 一 是 : 水 分 
子 之 间 的 相互 作用 比 水 分 子 与 绝 大 多 数 的 溶质 分 子 相互 作用 要 有 利得 多 。 结 
合 反 应 减少 了 溶质 -溶剂 的 净 分 界面 积 。 需 要 更 少 的 溶剂 分 子 包围 溶质 ， 因 
而 溶液 的 自由 能 减少 ， 导 致 结合 的 倾向 。 然 而 ， 按 照 同 样 的 标准 ， 朴 水 相互 
作用 没有 提供 结合 特异 性 的 机 制 , 例如 ， 选 择 性 结合 一 个 分 子 而 不 是 另 一 个 
具有 相似 形状 的 分 子 。 通 过 使 分 子 表面 形状 互补 可 获得 一 些 结合 的 特异 性 ， 
如 果 配 合 得 好 ， 范 德 华 相互 作用 大 。 近 来 的 大 多 数 计算 表明 ， 静 电 相 互 作 用 
实际 上 不 利于 结合 ， 静 电 相互 作用 对 结合 自由 能 的 贡献 几乎 总 是 正 的 。 与 不 
带电 荷 的 分 子 相 比 ， 使 分 子 的 结合 变 得 更 难 。 在 天 然 分 子 复合 物 中 ， 静 电 相 
互 作用 通常 被 用 来 创造 特异 性 。 形 状 相似 ， 静 电 分 布 不 同 的 反应 物 ， 产 生 明 
显 不 同 的 结合 自由 能 。 

静电 相互 作用 对 结合 的 贡献 明显 是 非 直觉 的 ， 因 为 相关 的 结合 经 常 发 生 
在 水 溶剂 中 ， 通 常 牺牲 反应 物 和 水 之 间 有 利 的 静电 相互 作用 支持 反应 物 之 间 
的 有 利 (通常 是 不 很 有 利 的 ) 相互 作用 。 分 子 结合 研究 中 出 现 的 一 个 问题 
E: 静电 相互 作用 对 分 子 间 结 合 的 贡献 是 否 是 不 利 的 ? 

任何 一 种 相互 作用 对 分 子 识别 的 贡献 都 无 法 精密 确定 。 主 要 原因 是 分 子 
间距 离 、 相 互 作用 的 相对 几何 位 置 和 形状 , 以 及 局 部 溶剂 环境 的 难以 确定 
性 。 一 般 来 说 ， 在 最 佳 距离 时 ， 相 互 吸引 的 电荷 -电荷 相互 作用 的 结合 能 大 
约 为 一 5kcal/mol， 电 荷 - 偶 极 子 相互 作用 的 结合 能 大 约 为 一 4kcal/mol， 偶 
极 子 - 偶 极 子 相 互 作用 的 结合 能 大 约 为 一 3kcal/mol,， 四 极 子 的 弱 相 互 作用 
的 结合 能 大 约 在 一 1 一 一 2.5kcal/mol 之 间 。 朴 水 相互 作用 的 能 量 约 为 
一 69. 2cal/(Az + mol), Andrews 等 研究 认为 在 考虑 到 溶剂 分 子 贡献 的 基础 
上 ,离子 键 、 氢 键 和 范 德 华 力 对 自由 能 的 贡献 分 别 在 一 10kcal/mol、 
一 3kcal/mol 和 一 1kcal/mol， 而 在 结合 时 每 失去 一 个 内 部 自由 度 的 自由 能 为 
十 0. 7kcal/mol ( 表 3. 1) 


xd 非 键 作用 能 量 的 经 验 值 
相互 作用 的 类 型 结合 能 /(kcal/mol) 


离子 键 —3.0——4.0 


su —0.48—1.9 


分 子 表面 —0. 069 
溶剂 可 及 表面 —0. 020~—0. 030 


疏水 相互 作用 /(1/A?) 


范 德 华 相互 作用 —1.0 
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水 作用 和 伦敦 色散 作用 最 不 具有 专 一 性 , WE 3.2. 实际 上 ， 不 会 仅 因 一 种 
相互 作用 而 发 生生 物 识别 ， 它 是 所 有 这 些 相 互 作用 的 综合 。 


表 3.2 化 学 基 团 间 的 相互 作用 


吸引 作用 对 结合 能 和 专 一 性 的 贡献 
ATE 
ar 
电荷 -永久 偶 极 子 
电荷 -诱导 偶 极 子 
多 极 子 -多 极 子 
ve 
маек 多 极 子 -诱导 多 极 子 
范 德 华 相互 作用 
BUKIERI 
排斥 作用 对 专 一 性 的 贡献 
ELIT 
ms 静电 排斥 作用 


3.5 基 团 间 识 别 与 接触 


分 子 识 别 和 结合 过 程 是 两 个 分 子 形成 复合 物 时 获得 自由 能 的 结果 。 这 种 
形成 复合 物 的 过 程 可 以 用 范 德 华 作 用 、 静 电 作 用 、 氢 键 和 朴 水 作用 描述 。 多 
亚 基 蛋白 ， 如 血红 蛋白 和 蛋白 -蛋白 复合 物 〈 如 胰 蛋 白 酶 和 胰 蛋 白 酶 抑制 剂 ? 
的 内 部 界面 是 致密 充填 和 互补 的 。 所 有 的 氢 键 供 体 和 和 氢 键 受 体 是 相互 配对 
的 ， 所 有 正 电 荷 和 负电 荷 也 相互 配对 。 两 个 表面 在 几何 上 相互 补充 。 互 补 有 
两 种 性 质 ， 立体 形状 互补 ， 因 为 两 个 分 子 结合 时 不 能 互补 的 表面 由 于 原子 
间 的 距离 太 近 造成 巨大 的 排斥 作用 ; @ 吸 引 相互 作用 的 互补 ,包括 电荷 互补 
(相互 结合 的 表面 必须 具有 相反 的 电荷 性 质 ， 从 而 形成 吸引 作用 而 不 是 排斥 
作用 ) 、 政 水 表面 互补 〈 朴 水 和 亲 水 表面 倾向 于 与 性 质 相同 的 表面 相互 作用 ， 
从 而 使 溶剂 的 效应 最 大 ) 、 氢 键 供 体 和 受 体 互补 〈 使 氢 键 的 形成 成 为 可 能 ) 。 

有 许多 蛋白 质 与 配 体 和 其 他 分 子 相互 作用 的 实例 (23.3), 其 中 自由 能 
的 差异 是 结合 专 一 性 的 基础 。 由 于 两 个 相互 作用 表面 的 立体 空间 必须 互补 ， 
电荷 和 氢 键 相互 作用 要 求 严格 的 相互 作用 对 象 , 任何 的 错 配 都 会 减少 结合 
能 。Chothia & Janin 认为 作用 的 专 一 性 是 由 氢 键 的 形成 决定 ; Fersht HAR 
变 研究 酷 氨 酰 -tRNA 合成 酶 的 结果 显示 ， 改 变 不 带电 荷 的 基 团 使 氨 键 形成 
受到 影响 时 ， 对 专 一 性 的 改变 是 1. 5 一 2. 5 倍 ， 改 变 不 带电 荷 的 基 团 引起 空 
间 排 斥 时 ,对 专 一 性 的 影响 是 1000 fit. Popplewell 等 利用 蛋白 A 和 抗体 IgG 
作为 模式 结合 系统 研究 未 配对 的 氢 键 受 体 和 供 体 对 两 个 分 子 的 结合 能 量 的 影 
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响 为 1. 3kJ (0. 31kcal) 。 
表 3.3 化 学 基 团 间 相互 作用 


受 体 


mom» A (Ш) HERC) 

表面 电势 正 ( 负 ) f GE) 电荷 KEN) 
Eti 受 ( 配 ) 体 配 ( 受 ) 体 qu 短 距离 (一 ) 
溶解 性 非 极 性 ( 极 性 ) 极 性 ( 非 极 性 ) 诱导 偶 极 JEN CU 
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方面 对 两 个 分 子 的 结合 有 贡献 。Chothia & Janin 总 结 为 : Bik fe 
分 子 形成 复合 物 的 稳定 力量 , 也 证 实 了 Kauzmann WRB, БИЙЛИ ЖН 
的 聚合 ， 小 分 子 的 结合 主要 是 疏水 相互 作用 的 结果 。 在 极其 稀少 的 情况 下 ， 
配 体 与 结合 部 位 的 亲 和 性 由 一 种 相互 作用 决定 ， 如 某 些 抗原 -抗体 复合 物 
(van Oss 等 ，1982) 。 数 种 相互 作用 对 一 个 亲 和 反 应 都 有 贡献 是 正常 的 ， 尽 
管 每 种 相互 作用 的 相对 贡献 从 一 个 复合 物 到 另 一 个 复合 物 会 有 所 变化 。 
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第 4 章 


从 序列 到 结构 


iiM, к RAD 


4.1 背景 介绍 


随 着 实验 技术 的 进步 ， 蛋 白质 测序 日 趋 成 为 一 种 常规 手段 。 从 NCBI Ref- 
Seq 数据 库 (http: //www. ncbi. nlm. nih. gov/refseq) 的 数据 来 看 ， 仅 从 2010 
年 5 月 9 日 到 2010 年 7 月 13 日 新 测序 并 被 注释 的 序列 数量 就 从 3549618 条 增 
加 到 了 3641224 条 ， 平 均 大 约 每 分 钟 就 有 一 条 新 的 序列 被 确定 ! 这 是 序列 库 ， 
蛋白 质 结构 数据 的 情况 怎么 样 呢 ? 截至 2010 年 8 月 31 日 17 时 ，PDB 数 据 库 
(Һир: //www. pdb. org) 中 已 测 结构 的 蛋白 质 为 67656 个 。 与 序列 库 相 比 ， 
这 个 数据 量 简直 少 得 可 怜 ! 需要 说 明 的 是 ， 这 其 中 还 有 相当 数量 的 元 余 。 然 
而 ， 从 应 用 的 角度 来 讲 ， 无 论 是 医学 上 的 药物 设计 还 是 生物 技术 中 的 酶 设计 ， 
需求 更 多 的 都 是 蛋白 质 的 结构 信息 。 基 于 结构 的 药物 设计 、 酶 设计 等 针对 性 
强 ， 方 便 、 快 捷 、 可 靠 ， 并 且 已 经 得 到 了 相当 广泛 的 应 用 。 如 果 仅仅 针对 已 
测 结构 的 蛋白 质 进行 设计 改造 的 话 ， 这 6 万 多 的 数据 量 是 远 远 不 够 的 。 从 另 一 
方面 讲 ， 序 列 数据 的 庞大 也 为 结构 研究 提供 了 一 种 潜在 的 资源 。 根 据 当今 生 
物 学 家 的 普遍 观点 ， 蛋 白质 的 一 维 序列 决定 了 蛋白 质 的 高 级 结构 。 也 就 是 说 ， 
仅 从 序列 出 发 ， 依 照 某 种 规律 是 可 以 将 蛋白 质 折 释 成 特定 的 高 级 结构 的 。 如 
果 有 一 天 这 种 规律 被 完全 揭示 的 话 ， 那 么 就 能 够 极 大 地 丰富 蛋白 质 的 结构 信 
息 ， 将 相关 领域 的 研究 提高 到 一 个 更 高 的 、 全 新 的 水 平 。 然 而 蛋白 质 结构 预 
测 ， 依 据 已 知 的 序列 来 预测 蛋白 质 的 高 级 结构 ， 这 是 困扰 生物 学 家 、 化 学 家 、 
物理 学 家 、 数 学 家 等 多 年 的 古老 话题 。 在 过 去 的 四 五 十 年 里 人 们 进行 了 各 种 
各 样 的 尝试 ， 并 取得 了 一 些 成 果 ， 但 是 到 目前 为 止 仍然 没有 哪 种 方法 能 够 仅 
从 序列 出 发 得 到 蛋白 质 的 合理 的 高 级 结构 。 

那么 蛋白 质 的 高 级 结构 到 底 是 什么 样 的 呢 ， 为 什么 这 么 难以 预测 呢 ? 我 
们 知道 ， 蛋 白质 是 由 单条 或 者 多 条 氨基 酸 链 弯 曲折 释 形 成 的 。 它 的 结构 从 简 
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单 到 复杂 可 以 分 为 一 级 结构 、 二 级 结构 、 三 级 结构 和 四 级 结构 。 一 级 结构 就 
是 组 成 蛋白 质 的 氨基 酸 序列 ， 序 列 通 过 不 同 的 方式 弯曲 可 以 产生 a 螺旋 、B 
折 释 和 无 规则 卷曲 等 二 级 结构 ， 二 级 结构 经 过 折 倒 、 组 合 可 以 形成 特定 的 三 
级 结构 。 一 般 而 言 ， 由 三 级 结构 组 成 的 蛋白 质 结构 域 就 有 一 些 简单 的 功能 
т, 但 是 要 完成 生物 体内 复杂 的 化 学 反应 还 需要 将 多 个 结构 域 按照 一 定 的 方 
式 组 合 起 来 ， 这 就 是 蛋白 质 的 四 级 结构 。 

蛋白 质 结构 预测 依据 所 预测 结构 的 不 同 可 以 分 为 二 级 结构 预测 、 三 级 结 
构 预测 和 四 级 结构 预测 三 个 大 的 类 别 。 下 面 我 们 针对 这 三 个 层次 的 预测 分 别 
作 一 简单 介绍 。 


4.2 蛋白质 二 级 结构 预测 


二 级 结构 预测 的 主要 目的 就 是 预测 蛋白 质 的 序列 可 能 形成 的 二 级 结构 ， 
哪些 地 方形 成 螺旋 、 哪 些 形成 折 公 以 及 哪些 形成 卷曲 。 这 种 预测 从 20 世纪 
70 年 代 的 Chou-Fasman 方法 经 过 СОК 方法 ， 到 今天 的 机 器 学 习 方法 ， 预 
测 准确 性 从 60% 提 高 到 80% 以 上 ， 接 近 二 级 结构 预测 的 理论 上 限 90%。 


4.2.1 Chou-Fasman 方法 


Chou-Fasman 方法 是 早期 依据 经 验 来 预测 蛋白 质 二 级 结构 的 一 种 方法 。 
这 种 方法 是 在 部 分 蛋白 质 结构 已 经 被 解析 之 后 出 现 的 。 经 过 对 已 解析 蛋白 质 
中 氨基 酸 分 布 的 统计 分 析 ， 人 们 发 现 ， 氨 基 酸 在 蛋白 质 不 同 二 级 结构 中 的 出 
现 是 具有 一 定 的 偏好 性 的 。 比 如 ， 丙 氨 酸 、 谷 氨 酸 、 甲 硫 氨 酸 等 有 很 高 的 概 
率 出 现在 螺旋 的 起 始 部 分 ， 而 甘氨酸 和 且 氨 酸 则 大 多 出 现在 螺旋 的 末端 。 依 
据 这 些 偏好 性 就 可 以 预测 序列 的 二 级 结构 了 。 这 种 方法 简单 明了 ， 速 度 也 很 
快 ， 但 是 预测 的 准确 性 太 低 。 初 期 可 能 是 因为 蛋白 质 晶体 结构 少 ， 这 些 氨基 
酸 偏好 性 参数 较 粗糙 ， 但 是 最 近 人 们 已 经 已 知 的 晶体 结构 更 新 了 氨基 酸 的 参 
数 ， 这 种 方法 所 能 达到 的 准确 率 也 才 只 有 5006 一 60% 。 这 是 因为 决定 蛋白 
质 二 级 结构 的 因素 很 多 ， 氨 基 酸 的 种 类 是 一 个 很 重要 的 因素 ， 但 并 不 完全 是 
决定 性 的 。 氨 基 酸 与 周围 氨基 酸 的 相互 作用 以 及 所 处 结构 环境 对 于 决定 该 氨 
基 酸 的 二 级 结构 同样 有 着 不 可 忽视 的 作用 ， 而 这 种 方法 忽略 掉 的 恰好 就 是 这 
些 因素 。 尽 管 这 种 方法 的 预测 准确 率 不 高 ， 但 是 它 对 蛋白 质 二 级 结构 预测 进 
行 了 早期 的 尝试 ， 并 为 日 后 的 预测 提供 了 一 种 可 行 的 思路 。 


4.2.2 GOR 方法 


GOR 方法 〈Garnier-Osguthorpe-Robson 方法 ) 是 继 Chou-Fasman 方 
法 出 现 后 不 久 发 展 出 来 的 另 一 种 基于 氨基 酸 概 率 参数 的 方法 。 与 Chou-Fas- 
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man 方法 不 同 ， 这 种 方法 除了 加 入 氨基 酸 在 不 同 二 级 结构 中 出 现 概率 的 参 
数 外 还 引入 了 一 种 限制 概率 ， 来 衡量 该 氨基 酸 周围 已 经 存在 的 二 级 结构 对 它 
的 影响 。 另外， 这 种 方法 采用 贝 叶 斯 统计 模型 来 进行 预测 。GOR 方法 对 螺 
旋 和 折 释 的 预测 有 了 较为 显著 的 提高 ， 但 是 对 转角 和 无 规则 卷曲 的 预测 还 存 
在 明显 的 不 足 。 这 种 方法 总 的 预测 准确 率 在 65% 左 右 。 近 年 来 ， 经 过 Garni- 
er 等 人 的 不 断 发 展 和 完善 ， 这 种 方法 的 准确 率 可 以 提高 到 73. 5%， 并 且 支 
持 在 线 预 测 。 他 们 的 网 址 为 : http: //gor. bb. iastate. edu, 


4.2.3 机 器 学 习 


生命 科学 的 发 展 为 物理 、 化 学 、 数 学 、 计 算 机 等 学 科 提 供 了 丰富 的 研究 
对 象 ， 机 器 学 习 方 法 在 蛋白 质 二 级 结构 中 的 应 用 就 是 一 个 很 好 的 例子 。 现 在 
使 用 最 多 、 准 确 率 最 高 的 应 该 就 是 机 器 学 习 方法 了 。 机 器 学 习 方 法 主要 有 两 
种 : 人 工 神经 网 络 方法 (artificial neural network, ANN) 和 支持 向 量 机 方 
法 (support vector machines, SVM). 
人 工 神经 网 络 也 称 为 神经 网 络 ， 是 受 生物 神经 网 络 工作 原理 的 启发 而 建 
立 起 来 的 一 种 数学 模型 (图 4. 1) 。 它 是 由 大 量 节点 (神经 元 ) 相互 连接 组 成 
的 运算 模型 。 神 经 网 络 中 每 个 神经 元 代表 了 一 种 特定 的 激励 函数 ， 神 经 元 之 
间 连 接 是 这 两 个 神经 元 之 间 的 信息 流通 量 的 权重 。 神 经 网 络 的 输出 值 随 着 网 
络 中 神经 元 激励 函数 和 神经 元 之 间 权 重 的 不 同 而 变化 。 用 已 知 的 信息 优化 神 
经 网 络 中 各 神经 元 的 激励 函数 和 权重 的 过 程 就 是 神经 网 络 学 习 的 过 程 。 这 个 
过 程 也 称 为 训练 ， 训 练 好 的 神经 网 络 可 以 用 于 预测 。 同 样 地 ， 蛋 白质 二 级 结 
构 预测 中 ， 可 以 先 用 已 知 晶 体 结构 中 氨基 酸 序列 和 所 处 二 级 结构 的 信息 训练 
神经 网 络 ， 然 后 再 用 来 预测 其 他 序列 的 结构 。 尽 管 不 能 有 效 地 预测 远程 氨基 
酸 之 间 的 氢 键 相互 作用 ， 但 是 这 种 方法 还 是 相当 可 靠 的 ， 其 预测 准确 率 可 以 
达到 70% 以 上 。 最 近 ， 英 国 邓 迪 大 学 (University of Dundee) Barton 课题 组 发 
юат 


图 4. 1 人 工 神经 网 络 示意 图 
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展 的 基于 神经 网 络 的 预测 程序 已 经 可 以 将 预测 准确 率 提高 到 81. 5% ， 他 们 的 
在 线 预 测 网 址 为 : http: //www. compbio. dundee. ac. uk/ www-jpred。 

支持 向 量 机 是 采用 监督 式 学 习 方法 的 ， 它 是 在 统计 分 类 和 回归 分 析 中 广 
泛 应 用 的 一 种 分 类 器 。 这 种 分 类 器 本 质 上 是 一 种 线性 分 类 方法 。 由 于 线性 分 
类 方法 简便 易 行 ， 在 很 多 领域 得 到 了 广泛 的 应 用 。 但 是 对 稍微 复杂 的 问题 ， 
线性 方法 的 验 端 也 是 显而易见 的 。 例 如 ， 图 4. 2(a) 中 的 分 类 问题 ， 很 难 用 一 
条 直线 将 圆 形 和 方形 两 种 变量 分 开 。 遇 到 这 种 问题 ， 线 性 分 类 方法 是 不 是 就 
完全 失灵 了 呢 ? 答案 是 否定 的 。SVM 方法 提供 了 一 种 新 的 思路 ， 是 的 ， 在 二 
维 平面 里 面 不 能 找到 一 条 直线 将 圆 形 和 方形 的 变量 分 开 ， 那么 如 果 我 们 把 这 
两 个 变量 映射 到 更 高 维度 的 空间 ， 比 如 三 维 空间 中 ， 会 怎么 样 呢 ? 如 图 4.2 
(b) 所 示 ， 在 更 高 维度 的 空间 中 很 容易 找到 一 个 或 者 一 组 超 平面 (hyperplane) 
将 这 两 个 变量 分 开 。 这 就 是 SVM 方法 实现 复杂 问题 分 类 的 方法 思想 。 由 于 
SVM 方法 具有 较 好 的 分 类 预测 能 力 ， 因 此 这 种 方法 也 被 用 于 蛋白 质 二 级 结构 
和 和 蛋白质 骨架 二 面 角 预 测 中 ， 并 且 取得 了 相当 好 的 结果 。 同 神经 网 络 方法 一 
样 ，SVM 方法 也 需要 先 用 已 知 的 结构 信息 训练 ， 然 后 才能 预测 ， 因 此 也 属于 
机 器 学 习 的 方法 。YASSPP 是 一 个 利用 SVM 方法 进行 预测 的 服务 器 ， 其 准确 
率 可 以 达到 79. 3%， 网 址 为 : http: //glaros. dtc. umn. edu/yasspp。 


@) e 
图 4.2 SVM 分 类 思想 示意 图 


如 今 ， 机 器 学 习 方 法 预测 蛋白 质 二 级 结构 已 经 得 到 广泛 应 用 ， 通 过 选取 
适当 的 训练 集 和 调整 结构 、 参 数 ， 能 够 将 预测 的 准确 率 提升 到 80% 以 上 。 


4.3 蛋白 质 三 级 结构 预测 


尽管 蛋白 质 三 级 结构 预测 比 二 级 结构 预测 更 具 现 实意 义 和 实 用 价值 , 但 
是 与 二 级 结构 的 预测 相 比 ， 蛋 白质 三 级 结构 的 预测 要 困难 得 多 。 到 目前 为 
止 ， 三 级 结构 预测 仍然 是 一 个 极 具 挑 战 性 的 课题 。 它 所 面临 的 主要 问题 是 蛋 
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白质 自由 能 的 计算 和 蛋白质 自 由 能 全 局 最 小 值 的 搜索 。 一 个 好 的 预测 要 遍历 
蛋白 质 所 有 可 能 的 构象 ， 而 蛋白 质 构象 是 由 氨基 酸 所 有 可 能 构象 排列 组 合 得 
来 的 ， 因 此 蛋白 质 构象 本 身 就 是 一 个 天 文 数字 。 要 从 蛋白 质 所 有 构象 中 找 出 
能 量 最 小 的 构象 ， 困 难 程度 可 想 而 知 。 一 种 相对 可 行 的 办 法 是 同 源 建 模 。 在 
目标 序列 的 所 有 同 源 蛋白 质 中 ， 如 果 某 一 个 或 者 几 个 的 晶体 结构 已 经 被 解 
析 ， 并 且 它 们 与 目标 序列 的 相似 性 在 40% 以上， 那么 就 可 以 以 同 源 蛋白 质 
的 晶体 结构 为 模板 来 预测 目标 序列 的 三 维 结构 。 这 种 方法 计算 量 小 ， 并 且 预 
测 结果 比较 可 靠 ， 因 此 得 到 广泛 应 用 。 


4.3.1 蛋白 质 结构 的 从 头 预测 


蛋白 质 结构 的 从 头 预 测 是 仅 从 序列 出 发 ， 依 据 物理 学 和 蛋白 质 折合 基本 
原理 来 进行 三 维 结构 预测 的 一 种 方法 。 与 其 他 方法 不 同 的 是 ， 它 不 依赖 任何 
已 经 解析 的 蛋白 质 结构 ， 仅 根据 理论 进行 预测 。 它 对 物理 学 、 化 学 、 结 构 生 
物 学 和 结构 基因 组 学 都 具有 潜在 的 重大 意义 。 但 是 这 种 方法 的 预测 是 非常 困 
难 的 ， 它 所 面临 的 问题 主要 是 如 何 对 巨大 的 蛋白 质 构象 空间 进行 搜索 和 如 何 
寻找 蛋白 质 自由 能 的 全 局 最 小 值 。 目 前 ， 一 种 可 行 的 解决 办 法 是 先 将 20 种 
氨基 酸 所 有 可 能 的 构象 存储 起 来 做 成 “候选 构象 ”或 者 “诱饵 构象 ” Ccan- 
didate structure or decoy structure) ， 然 后 依据 打分 函数 (scoring function) 
来 引导 构象 空间 的 搜索 。 氨 基 酸 每 变换 一 种 构象 就 依据 打分 函数 中 的 规则 对 
体系 打分 ， 然 后 根据 得 分 的 不 同 将 构象 排序 优选 出 最 佳 构象 。 常 用 的 打分 函 
数 有 两 种 : 一 种 是 基于 数学 模型 和 物理 学 原理 的 打分 函数 ; 另 一 种 是 基于 统 
计 模 型 的 打分 函数 。 这 种 方法 中 打分 函数 起 了 非常 重要 作用 ， 因 此 选择 一 个 
合适 的 打分 函数 是 这 种 方法 的 关键 。 

蛋白 质 结构 的 从 头 预 测 是 一 个 庞大 的 工程 ， 它 不 仅 需要 好 的 算法 ， 还 需 
要 巨大 的 计算 资源 。 目 前 ， 除 超级 计算 机 如 IBM 的 Blue Gene 和 日 本 RIK- 
EN 研究 所 的 MDGRAPE-3 以 外 ， 一 些 分 布 式 计 算 项 目 如 Folding@home, 
Human Proteome Folding Project 和 Rosetta (2 home 等 也 在 尝试 解决 这 一 
难题 。 


4.3.2 蛋白 质 结构 的 同 源 建 模 


同 源 建 模 是 目前 从 序列 预测 结构 的 最 切实 可 行 、 应 用 最 广泛 的 一 种 方 
法 。 上 海 交通 大 学 生命 科学 与 技术 学 院 生 物 信息 学 实验 室 魏 冬 青 教授 课题 组 
就 运用 这 种 方法 对 细胞 色素 酶 CYP450 家 族 的 许多 成 员 进行 了 同 源 建 模 ， 并 
以 此 为 基础 开展 了 一 系列 的 酶 催化 机 理 、 药 物 设计 等 相关 的 研究 工作 。 同 源 
建 模 方法 使 用 与 目标 序列 同 源 的 某 一 蛋白 质 的 实验 结构 作为 模板 ， 对 目标 序 
列 进 行 三 维 结构 的 预测 。 使 用 这 种 方法 有 两 个 前 提 条 件 : 首先 ， 目 标 序 列 的 
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同 源 蛋白 质 中 某 一 个 或 者 几 个 结构 已 经 被 解析 CX 射线 或 者 NMR 结构 均 
"D; 其 次 ， 目 标 序列 与 该 蛋白 质 的 同 源 性 足够 高 ， 一 般 50% 以 上 的 同 源 性 
能 够 得 到 比较 合理 的 构象 。 同 源 建 模 一 个 重要 的 理论 依据 就 是 蛋白 质 三 级 结 
构 比 氨基 酸 序列 更 保守 。 在 生物 体 中 即使 差别 比较 大 的 同 源 蛋 白 也 可 以 被 折 
释 成 类 似 的 三 维 结构 ， 发 挥 相似 的 功能 。 这 样 的 规律 也 有 例外 ， 例 如 ， 突 变 
小 于 50%% 序 列 的 一 个 蛋白 质 就 会 折 短 成 不 同 的 结构 。 

同 源 建 模 的 过 程 一 般 包 括 四 步 : 模板 选择 、 序 列 比 对 、 构 建 模型 和 模型 
评估 。 前 两 个 过 程 经 常 是 一 起 进行 的 ， 模 板 选择 通常 的 方法 要 基于 序列 比 对 
的 结果 。 然 而 ， 由 于 数据 库 搜索 技术 优先 考虑 速度 而 不 是 准确 度 ， 使 得 比 对 
结果 并 不 一 定 完全 正确 ， 这 些 过 程 可 以 重复 进行 来 改善 最 终 模型 的 质量 。 在 
大 规模 的 自动 结构 预测 中 ， 优 化 过 程 的 速度 和 准确 度 对 于 结构 基因 组 学 的 研 
究 很 重要 ， 因 为 数据 量 太 大 不 可 能 手工 操作 ， 而 且 结构 基因 组 学 的 目标 是 为 
那些 不 是 结构 预测 专家 的 研究 人 员 提 供 合理 正确 的 模型 。 


4.3.2.1 模板 选择 和 序列 比 对 

同 源 建 模 的 第 一 步 是 找到 最 好 的 模板 结构 ， 最 简单 的 方法 是 使 用 基于 一 
系列 双 序列 比 对 的 数据 库 搜索 技 术 ， 如 FASTA、BLAST， 以 及 敏感 度 更 高 
的 基于 多 重 序列 比 对 的 方法 ， 如 PSI-BLAST， 通 过 重复 更 新 特定 位 点 的 打 
分 和 矩阵 发 现 更 多 的 远 源 同 源 模板 。 这 类 方法 能 查找 出 很 多 的 潜在 模板 ， 并 确 
定 序列 的 更 好 模板 。 和 蛋白 质 线索 技术 (protein threading) 在 传统 同 源 建 模 
方法 中 也 用 于 发 现 模板 的 搜索 技术 。 

通过 这 些 方法 通常 会 得 到 很 多 候选 的 模板 结构 ， 虽 然 一 些 方法 能 从 许多 
模板 中 获得 多 杂 合 模型 ， 但 是 大 部 分 的 方法 还 是 基于 单一 模板 。 因 此 ， 模 板 
的 选择 对 于 最 终结 构 的 准确 性 就 很 重要 。 选 择 模板 时 可 以 考虑 几 个 因素 ， 比 
如 目标 和 模板 序列 的 相似 度 、 功 能 的 差别 、 模 板 和 目标 蛋白 的 二 级 结构 等 。 
这 样 ， 序列 比 对 的 释 合 区 和 得 到 的 模型 就 很 重要 ， 有 时 一 个 序列 使 用 几 个 同 
源 的 模型 ， 在 最 后 一 步 才 会 选择 最 好 的 模型 。 


4.3.2.2 建立 模型 

用 来 建立 模型 的 方法 主要 有 三 种 一 一 序列 拼接 、 片 段 匹 配 和 空间 限制 。 
序列 拼接 的 方法 基于 完整 模型 从 同 源 性 的 保守 结构 拼接 而 成 ， 例 如 ， 一 个 哺 
乳 动物 中 丝氨酸 蛋白 酶 的 建 模 发 现 核心 区 的 结构 相当 保守 ,但 是 有 大 部 分 不 
同 序列 的 环形 可 变 区 则 有 很 大 差异 。 因 此 ， 建 模 时 可 以 先 建立 保守 的 核心 
区 ， 再 从 已 知 结构 的 蛋白 中 替换 可 变 区 的 结构 。 这 种 方法 的 关键 在 于 怎么 处 
理 非 保守 区 和 缺少 模板 的 区 域 ， 而 可 变 区 的 建立 通常 依靠 已 知 结构 的 片段 
文库 。 

片段 匹配 的 方法 是 把 目标 蛋白 分 成 一 系列 的 段 片段 ， 每 一 个 片段 都 与 
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PDB 中 的 对 应 模板 相 匹配 。 由 于 蛋白 质 结构 中 的 大 多 数 六 肽 片段 都 属于 仅 
100 个 左右 的 不 同 的 结构 家 族 。 所 以 ， 利 用 一 个 被 选 定 的 模板 结构 中 的 原 
子 位 置 的 子 集 作为 引导 位 置 ， 通 过 不 断 地 寻找 和 组 合 符合 引导 结构 的 片 
段 ， 可 以 对 目标 蛋白 做 同 源 建 模 。 因 此 ， 片 段 匹配 法 中 序列 比 对 是 分 片段 
进行 的 ， 而 不 是 整个 蛋白 质 。 每 个 片段 模板 的 选择 基于 相应 序列 的 相似 
性 、a 碳 坐标 的 比较 、 目 标 蛋 白 和 模板 蛋白 间 不 同 原子 范 德 华 力 所 造成 的 
空间 位 阻 等 。 

目前 空间 限制 法 也 是 常用 的 方法 之 一 。 该 方法 首先 从 NMR 得 到 的 实验 
数据 中 提取 构建 蛋白 质 三 维 结构 所 需 的 数据 ; 然后 ， 用 一 个 或 多 个 目标 模版 
建立 一 套 几 何 结构 标准 ; 接着 把 这 套 标准 转化 成 概率 密度 函数 ， 用 于 限制 新 
建 蛋 白质 的 蛋白 质 骨架 距离 和 二 面 角 。 同 时 ， 这 套 标准 也 用 于 对 蛋白 质 中 所 
有 重 原子 进行 全 局 结构 最 优化 。 空 间 限 制 法 对 螺旋 和 折 和 看 的 预测 表现 出 色 ， 
因此 得 到 了 广泛 应 用 ， 但 是 这 种 方法 仍然 没有 很 好 地 解决 蛋白 质 环 区 的 结构 
预测 ， 这 是 由 于 蛋白 质 环 区 在 溶液 中 非常 柔软 、 构 象 多 变 ， 目 标 序列 和 模板 
蛋白 之 间 很 难 有 一 个 精确 的 匹配 。 目 前 流行 的 同 源 建 模 软件 MOLELLER 
(http: //salilab. org/modeller/) 和 同 源 建 模 数据 库 ModBase (http: // 
modbase. compbio. ucsf. edu/modbase-cgi/index. cgi) 使 用 的 就 是 空间 限 
制 法 。 


4.3.2.3 环 区域 的 建 模 

目标 序列 中 与 模板 没有 合 合 区 的 区 域 都 是 通过 环 区 域 建 模 构建 的 ， 在 目 
标 蛋 白 和 模板 蛋白 有 很 小 的 序列 相似 性 时 最 容易 发 生 建 模 错误 。 这些 未 匹配 
的 区 域 比 那些 有 模板 结构 对 应 的 区 域 大 体 上 缺少 准确 率 ， 尤 其 是 大 于 10 个 
碱 基 的 环 。 最 先 的 两 个 侧 链 二 面 角 〈X1 和 X2) 对 于 一 个 准确 的 骨架 结构 可 
以 估计 为 30"， 然 而， 接着 在 长 侧 链 〈 如 赖 氨 酸 和 精 氨 酸 ) 的 二 面 角 则 很 难 
预测 。 而 且 ，X1 的 小 错误 就 有 可 能 导致 侧 链 末端 原子 位 置 的 很 大 偏 移 ， 这 
些 原子 一 般 功 能 都 很 重要 ， 特 别 是 位 于 活性 中 心 附近 。 


4. 3.2.4 模型 评估 

没有 真实 目标 蛋白 结构 参考 时 ， 同 源 建 模 结果 的 评估 一 般 有 两 种 方法 : 
统计 势能 和 基于 物理 能 量 计 算 。 两 种 方法 都 是 对 模型 的 能 量 做 出 评估 ， 但 是 
都 不 能 完全 符合 真实 的 结构 ， 尤 其 是 PDB 中 数量 很 少 的 蛋白 ， 如 膜 蛋白 。 

统计 势能 是 一 种 经 验方 法 ， 通 过 PDB 中 已 知 结构 蛋白 残 基 间 的 相互 碰 
撞 频 率 计 算 。 给 两 氨基 酸 相互 作用 时 分 配 一 种 可 能 性 或 能 量 值 ， 然 后 合并 成 
完整 模型 的 能 量 值 。 其 中 有 些 方法 对 两 残 基 间 的 评估 效果 很 差 ， 但 是 整体 模 
型 有 合理 的 得 分 ， 而 且 认为 疏水 核心 和 极 性 氨基 酸 一 般 形成 球状 。 比 较 常 用 
的 方法 有 Prosa, DOPE 等 ， 该 方法 比 能 量 计 算 效 率 更 高 。 
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基于 物理 能 量 计算 的 方法 需要 获得 溶液 中 稳定 蛋白 的 内 部 原子 相互 作用 
力 ， 特 别 是 范 德 华 力 和 静电 作用 。 这 些 计算 通常 使 用 分 子 力 场 表 示 ， 这 是 因 
为 这 些 体 系 对 于 半 经 验 量子 力学 方法 来 说 仍然 太 大 了 。 利 用 物理 能 量 计算 来 
评估 蛋白 的 方法 基于 蛋白 折 释 的 能 量 面 假说 ,该 假说 认为 处 在 自然 状态 
(native state) 下 的 蛋白 质 对 应 于 能 量 面 的 极 小 值 。 在 计算 能 量 过 程 中 通常 
采用 隐 式 溶剂 化 模型 来 估算 蛋白 质 分 子 在 溶液 中 的 状态 。 模 型 评估 中 使 用 的 
力 场 称 为 有 效力 场 (effective force field，EFF)， 是 一 种 根据 CHARMM JJ 
场 原 子 参数 为 模型 评估 专门 建立 的 力 场 。 

模型 评估 可 以 使 用 专门 的 评估 软件 ОШ “What Check”) 完成 。 该 软件 
是 荷兰 内 梅 享 大 学 免费 提供 的 ， 它 可 以 对 模型 的 接近 200 个 方面 进行 评估 。 
此 外 ， 这 一 软件 也 可 以 用 来 对 实验 获得 的 生物 大 分 子 结构 进行 验证 。 它 的 网 
HEA: http: //swift. cmbi. ru. nl/gv/whatcheck, 

当 蛋 白质 结构 已 知 时 ， 同 源 建 模 准 确 性 的 评估 就 很 简单 ， 最 普通 的 方法 
就 是 使 用 根 均 方 误差 (root mean square deviation, RMSD) 度量 ,在 两 个 
结构 全 合 后 计算 相应 原子 的 平均 距离 。 然 而 ，RMSD 对 于 核心 区 准确 但 是 
可 变 环 区 不 准确 的 模型 评估 不 足 。 在 CASP 模型 评估 实验 中 引入 的 新 方法 
称 为 全 局 距离 测量 (global distance test) ， 测 出 所 有 原子 在 某 截 距 时 模型 和 
实验 结构 的 距离 。 这 些 方法 可 以 用 于 结构 中 的 所 有 原子 ， 但 通常 用 于 а 碳 和 
蛋白 质 骨 架 原子 ， 这 样 能 够 降低 侧 链 旋 转 所 造成 的 影响 。 

同 源 建 模 还 可 以 用 于 鉴别 相关 蛋白 间 的 细微 差别 ， 如 可 以 鉴别 Nat / 
K*-ATPase 的 阳离子 结合 位 点 ， 也 可 以 预测 结合 强 弱 。 与 分 子 动力 学 模拟 
一 起 ， 同 源 建 模 还 能 预测 一 个 蛋白 质 的 动力 学 特征 ， 如 钾 离 子 通道 的 离子 选 
择 性 。 在 基因 组 的 蛋白 编码 区 的 大 规模 自动 建 模 已 开始 在 酿酒 酵母 菌 中 进行 
研究 ， 结 果 产 生 近 1000 个 未 知 结构 的 蛋白 质 模型 ， 也 发 现 236 个 酵母 蛋白 
间 新 的 相互 关系 。 目 前 常用 的 同 源 建 模 软件 有 SWISS-MODEL (http: // 
swissmodel. expasy. org), ROBETTA (http: //robetta. org), FoldX (ht- 
tp: //foldx. crg. es) 等 。 


4.3.3 同 源 建 模 实例 


细胞 色素 酶 CYP450 是 一 个 大 的 蛋白 质 家 族 ， 其 成 员 主要 负责 生物 体内 
药物 及 小 分 子 的 代谢 ， 在 多 种 生物 体内 均 有 分 布 。 上 海 交通 大 学 生命 科学 与 
技术 学 院 生物 信息 学 实验 室 魏 冬 青 教授 课题 组 对 该 家 族 蛋白 进行 了 全 面 的 研 
究 ， 发 现 该 家 族 中 多 数 蛋 白质 序列 已 经 测定 且 同 源 性 很 高 ， 但 是 只 有 少数 几 
个 存在 晶体 结构 。 因 此 ， 可 以 应 用 同 源 建 模 方法 建立 出 非常 可 靠 的 模型 。 
2004 年 首次 报道 了 CYP2C9 的 晶体 结构 。 魏 教授 课题 组 顾 若 虚 等 以 此 作为 
模版 对 CYP2C19 进行 了 同 源 建 模 。 具 体 方法 如 下 所 述 : 
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CYP2C9 的 蛋白 序列 含有 492 个 氨基 酸 ， 而 CYP2C19 的 蛋白 序列 含有 
490 个 氨基 酸 。 顾 若 虚 等 通过 课题 组 内 部 有 自主 知识 产权 的 软件 SAMM 
(Shanghai Molecular Modeling) 对 CYP2C9 和 CYP2C19 的 蛋白 质 序列 进行 
了 序列 比 对 。 他 们 发 现 ， 序 列 比 对 的 一 致 性 得 分 与 比 对 的 方式 密切 相关 。 当 
以 蛋白 质 的 二 级 结构 作为 约束 条 件 的 时 候 ， 比 对 得 分 为 52% 。 如 果 去 掉 这 
个 约束 条 件 ， 纯粹 基于 序列 做 比 对 的 时 候 ， 得 分 增加 到 91%， 这 个 结果 和 
NCBI BLAST (http: //www. ncbi. nlm. nih. gov/blast/) 的 结果 相似 。 考 
虑 到 两 个 酶 的 结构 和 功能 相似 ， 因 此 二 级 结构 对 酶 最 终 的 结果 影响 很 大 ， 他 
们 采取 了 以 二 级 结构 作为 约束 条 件 时 得 到 的 结果 。 序 列 比 对 结果 如 图 4.3 
BUR. 

根据 CYP2C9 (PDB code 1R90) 的 晶体 结构 和 序列 比 对 的 结果 ， 他 们 
通过 片段 匹配 的 方法 构建 了 CYP2C19 的 三 维 结构 模型 。 之 所 以 使 用 片段 匹 
配 的 方式 构建 ， 是 因为 这 种 方法 已 经 非常 成 熟 ， 而 且 有 不 少 成 功 的 例子 。 例 
如 ,在 caspase-3 的 晶体 结构 被 测定 之 前 ， 曾 经 用 片段 匹配 方法 构建 
caspase-8 蛋白 酶 结构 域 的 三 维 结构 模型 。 为 了 得 到 一 个 合适 的 模板 ， 首 先 
以 caspase-1 的 晶体 结构 为 模板 建立 了 caspase-3 催化 结构 域 的 三 维 结构 模 
型 ， 然 后 以 得 到 的 三 维 结构 为 模板 ， 进 一 步 构建 了 caspase-8 蛋白 酶 结构 域 
的 三 维 结构 模型 。 之 后 的 实验 测定 的 晶体 结构 显示 ， 计 算 机 构建 的 caspase- 
3 和 caspase-8 的 三 维 结构 模型 与 它们 的 晶体 结构 非常 相似 ， 比 如 : caspase- 
3 蛋白 酶 结构 域 的 晶体 结构 和 其 计算 机 结构 模型 的 所 有 骨架 原子 位 置 的 标准 
偏差 (RMSD) % 2.7A, iif caspase-8 蛋白 的 相应 值 为 3. 1A， 其 核心 结构 
的 标准 偏差 仅 为 1. 2A。 随 后 ， 许 多 蛋白 质 都 用 片段 匹配 的 方法 成 功 建立 了 
三 维 结构 模型 ， 如 : 以 RAIDD CARD 的 核磁 共振 结构 为 模板 ， 建 立 了 
Apaf-1、Ced-4 和 Ced-3 的 CARDs (caspase recruitment domains) 结构 域 
的 三 维 结构 模型 ， 此 外 还 有 Cdk5-Nck5a* 复合 体 和 caspase-9 蛋白 酶 结构 域 
的 三 维 结构 模型 。 

Cdk5-Nck5a* 复合 体 的 三 维 结构 的 计算 机 模型 发 表 之 后 两 年 ， 它 的 晶 
体 结构 被 测定 了 ， 人 们 发 现 二 者 基本 上 是 相同 的 。Cdk5 和 Nck5a* 相 结合 
时 被 包 囊 的 表面 积 为 3400A?， 而 通过 计算 机 模拟 得 到 的 结果 为 3461A? 。 
同时 ， 基 于 Cdk5-Nck5a* -ATP 的 计算 机 结构 模型 ， 人 们 进行 了 分 子 截 短 
的 实验 ， 结 果 确 认 并 拓展 了 计算 机 模型 所 做 出 的 预言 。 片 段 匹 配方 法 还 被 
用 于 构建 beta- 分 泌 酶 酶 原 的 三 维 结构 模型 并 进一步 为 beta- 分 泌 酶 的 前 体 
不 能 像 Shi 和 Benjannet 等 所 提 到 的 普通 酶 原 那样 抑制 活性 提供 了 令 人 信服 
的 解释 。 

最 近 片段 匹配 的 方法 被 用 于 构建 许多 蛋白 质 的 细胞 外 结构 域 的 三 维 结构 
BUS, d. 1,2,3,5 四 种 亚 型 的 GABA-A fk, BACE2, H5N1-NA, 
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图 4.3 CYP2C19 (Chain 1) 和 CYP2C9 (Chain 2) 的 序列 比 对 ( 见 彩 图 ) 
其 中 氨基 酸 按 其 不 同 的 功能 标记 为 不 同 的 颜色 : 红色 ， 蓝 色 ， ме, RR, RR. де. me. 
分 别 代表 该 氨基 酸 为 酸性 的 ， 碱 性 的 ， 中 性 亲 水 的 ， 脂 肪 族 ， 芳 香 族 ， 含 硫 的 ， 含 亚 氨基 的 
两 条 序列 的 相似 度 为 52% 


СЕАТ, cathepsin-E, alpha-7 烟 碱 乙酰 胆 碱 受 体 和 人 类 的 钾 通道 和 钠 通道 
蛋白 。 
顾 若 虚 等 的 研究 以 CYP2C9 (PDB code 1R90) 为 模板 经 过 以 下 四 步 
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完成 了 对 СҮР2С19 酶 的 建 模 : 把 目标 链 断 裂 成 一 系列 短 的 片段 ; 
ORRUA 5200 个 高 分 辩 率 蛋白 质 晶体 结构 的 蛋白 质数 据 库 (Protein 
Data Bank , PDB) ， 以 图 4. 3 中 显示 的 序列 比 对 和 模板 蛋白 的 引导 位 置 
为 依据 ， 寻 找 合 适 的 目标 链 的 匹配 片段 ; @ 将 搜索 到 的 匹配 片段 添加 到 
不 断 增长 的 目标 结构 上 去 ， 以 避免 范 德 华 重 释 为 原则 ， 直 到 获得 目标 结 
构 的 所 有 原子 位 置 ; @ 重 复 以 上 三 步 10 次 ,产生 一 个 平均 模型 ， 通过 
能 量 最 小 化 得 到 最 终 的 结构 。 他 们 构建 的 CYP2C19 的 三 维 结构 模型 如 
图 4.4 所 示 。 


图 4.4 以 CYP2C9 (PDB code 1R90) 为 模板 作 同 源 
建 模 得 到 的 CYP2C19 的 三 维 结构 模型 
蛋白 质 骨 架 以 平板 和 组 带 结构 表示 


随后 顾 若 虚 等 又 对 此 模型 做 了 模型 评估 。 接 着 他 们 在 该 模型 的 基础 上 进 
行 了 单 点 突变 、 分 子 动力 学 模拟 和 大 规模 分 子 对 接 等 一 系列 个 性 化 药物 设计 
研究 ， 并 取得 了 很 好 的 成 果 。 


4.4 蛋白 质 四 级 结构 预测 


蛋白 质 的 四 级 结构 是 由 不 同 结构 域 相互 组 合 而 成 的 。 四 级 结构 的 预测 就 
是 对 蛋白 质 -蛋白 质 相互 作用 方式 的 预测 。 它 是 生物 信息 学 和 结构 生物 学 的 
综合 应 用 。 这 种 预测 主要 分 为 两 大 类 。 一 类 从 系统 发 生 和 蛋白质 共 进化 的 角 
度 出 发 ， 应 用 数学 模型 、 统 计 学 模型 来 预测 蛋白 质 的 相互 作用 。 这 种 方法 可 
以 预测 的 蛋白 质 很 多 ， 不 论 蛋 白质 有 没有 结构 都 可 以 预测 ， 但 是 不 能 给 出 两 
个 蛋白 质 的 结构 信息 和 结合 方式 。 另 一 类 是 从 两 个 蛋白 质 结构 出 发 ， 利 用 物 
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理学 原理 进行 的 预测 ， 又 称 为 蛋白 质 对 接 (protein-protein docking) 或 者 大 
分 子 对 接 (macromolecular docking) 。 这 种 方法 通过 计算 两 个 蛋白 质 不 同 结 
合 模式 下 的 形状 互补 性 、 结 合 能 /自由 能 等 特征 ， 来 判断 该 结合 模式 的 优 劣 。 
结合 能 的 计算 主要 根据 力 场 参数 〈force field) 进行 ， 优 劣 的 综合 判断 依靠 
打分 函数 (scoring function) 实现 。 

四 级 结构 的 预测 还 不 成 熟 ， 需 要 进一步 的 发 展 。 目 前 可 以 进行 四 级 结构 
预测 的 工具 有 STRING (http: //string-db. org), PPIs (http: //www. 
compbio. dundee. ac. uk/www-pips), metaPPI (http; //scoppi. biotec. tu- 
dresden. de/metappi), ZDOCK (http: //zdock. bu. edu) 等 。 


4.5 ”结束语 


蛋白 质 结构 预测 意义 非常 重大 。 从 20 世纪 60 年 代 开始 产生 到 现在 更 发 
展 成 为 一 个 生物 信息 学 、 计 算 机 科学 、 数 学 、 物 理 和 化 学 等 多 学 科 交 叉 的 热 
点 研究 领域 。 原 有 的 计算 方法 不 断 改进 ， 全 新 的 方法 、 思 路 不 断 涌现 ， 随 之 
而 来 的 是 预测 精度 和 深度 的 不 断 提高 。 然 而 ， 纵 观 学 科 发 展 ， 现 有 的 预测 方 
法 仍然 不 能 满足 社会 应 用 ， 特 别 是 制药 领域 和 酶 工业 对 蛋白 质 结构 信息 的 需 
求 。 正 因为 如 此 ， 经 过 半 个 世纪 的 发 展 ， 这 个 学 科 仍然 具有 非常 广阔 的 空间 
等 待人 们 去 探索 。 
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第 5 章 


蛋白 质 结构 模 怨 在 蛋白 研究 由 
B ru FAS 1 
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5.1 引言 


蛋白 质 结构 模拟 主要 是 基于 分 子 模拟 理论 。 简 单 的 分 子 模拟 可 以 采用 机 
械 模 拟 或 者 是 用 笔 和 纸 做 计算 。 然 而 ， 生 物体 中 的 蛋白 质 结构 相对 于 简单 的 
分 子 是 相当 复杂 的 ， 从 前 的 方法 难以 将 蛋白 质 体系 的 运动 状态 和 性 质 描 述 清 
楚 。 电 子 计算 机 的 出 现 及 其 相关 技术 的 发 展 ， 解 决 了 这 一 难题 ， 使 蛋白 质 模 
拟 进 入 了 一 个 前 所 未 有 的 光明 时 代 。 因 此 ， 现 在 科学 家 们 将 量子 力学 、 分 子 
力学 、 构 象 分 子 以 及 其 他 的 利用 计算 机 来 理解 和 预测 分 子 体系 的 方法 结合 在 
一 起 ， 来 观察 、 描 述 和 模拟 蛋白 质 分 子 体系 的 行为 。 

在 蛋白 质 模拟 的 过 程 当 中 ， 经 常会 提 到 “模型 ”一 词 ， 所 谓 的 模型 就 是 
用 最 简单 的 方式 使 人 们 形象 地 认 知 分 子 的 三 维 结构 。 最 为 著名 的 模型 如 
Dreiding 等 发 展 的 球 棍 模 型 Corey, Pauling 和 Koltun 等 发 展 的 СРК 模型 
等 。 这 些 模 型 广泛 地 应 用 于 教学 和 科研 工作 之 中 。 蛋 白质 结构 模拟 研究 可 以 
概括 为 以 下 三 个 过 程 。 第 一 步 是 建立 一 个 模型 用 于 描述 蛋白 体系 的 分 子 间 和 
分 子 内 的 相互 作用 。 在 模拟 研究 中 最 常用 的 两 种 模型 是 量子 力学 和 分 子 力 学 
模型 ， 利 用 它们 可 以 计算 出 体系 中 原子 和 分 子 的 任意 一 种 分 布 的 能 量 ， 并 且 
可 以 观察 到 随 着 体系 中 原子 或 分 子 位 置 的 改变 ， 体 系 能 量 是 怎样 变化 的 。 第 
二 步 是 进行 能 量 最 小 化 、 分 子 动力 学 模拟 、 蒙 特 卡 罗 模 拟 和 构象 搜索 等 一 系 
列 体系 自身 内 的 计算 。 最 后 一 步 就 是 将 以 上 两 步 得 到 的 计算 结果 进行 分 析 。 

本 章 主要 是 通过 列举 实例 ， 让 大 家 进一步 理解 这 三 个 步骤 的 具体 操作 过 程 ， 
为 以 后 灵活 运用 蛋白 质 结构 模拟 这 种 方法 来 研究 大 家 感 兴趣 的 蛋白 质 提供 帮助 。 
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5.2 蛋白 质 结构 的 预测 


研究 蛋白 质 的 空间 结构 意义 重大 ， 研 究 蛋 白质 结构 ， 有 助 于 了 解 蛋白 质 
的 作用 ， 了 解 蛋白 质 如 何 行使 其 生物 学 功能 ， 认 识 蛋白 质 之 间或 蛋白 质 与 其 
他 分 子 之 间 的 相互 作用 都 非常 重要 。 而 且 ， 在 所 有 的 蛋白 质 模拟 研究 中 ， 蛋 
白质 结构 是 基础 ， 所 有 的 计算 都 起 始 于 蛋白 质 的 结构 。 所 以 ， 如 何 得 到 准确 
的 蛋白 质 结构 ， 是 正确 模拟 蛋白 质 的 必要 条 件 。 

目前 蛋白 质 结构 的 测定 技术 主要 有 X 射线 晶体 衍射 法 (X-ray diffrac- 
tion) 、 二 维和 多 维 核 磁 共 振 技 术 (nuclear magnetic resonance, NMR), if 
过 这 些 技术 测 得 的 生物 大 分 子 三 维 结构 ， 都 收集 在 蛋白 质 结构 数据 库 (Pro- 
tein Data Bank, PDB) 中 ,通过 这 个 数据 库 我 们 可 以 轻松 地 获得 蛋白 质 的 
PDB 结构 文件 并 进行 计算 。 尽 管 蛋白 质 结 构 测定 技术 有 了 较为 显著 的 进展 ， 
但 是 通过 实验 方法 确定 蛋白 质 结构 的 过 程 仍然 非常 复杂 ， 代 价 较 高 ， 因 此 实 
验 测定 的 蛋白 质 结构 比 已 知 的 蛋白 质 序列 要 少 得 多 。 所 以 出 现 了 许多 蛋白 质 
结构 的 预测 方法 ， 主 要 包括 同 源 建 模 法 、 折 簿 识别 法 、 从 头 计 算法 等 。 这 些 
方法 的 原理 之 前 已 经 有 所 介绍 ， 我 们 就 不 在 这 里 歼 述 了 。 由 于 同 源 建 模 法 是 
目前 应 用 最 为 广泛 的 蛋白 质 三 维 结构 预测 方法 ， 所 以 我 们 在 这 里 就 以 同 源 性 
方法 为 实例 ， 讲 解 如 何 预测 蛋白 质 的 三 维 结构 。 

一 般 同 源 建 模 法 推测 蛋白 结构 需要 以 下 六 个 步骤 : 第 一 步 模板 蛋白 的 
搜索 ; 第 二 步 目标 蛋白 质 和 模板 蛋白 的 序列 比 对 ; 第 三 步 主 链 结 构建 模 ; 
第 四 步 环 区 建 模 ; 第 五 步 侧 链 建 模 和 优化 ; 第 六 步 整体 结构 优化 。 这 些 步 
又 可 以 用 不 同 的 程序 分 别 完成 ， 也 可 以 使 用 同 源 建 模 服务 器 或 者 自动 建 模 
的 程序 来 完成 。 现 在 ， 有 很 多 在 线 工 具 也 可 以 实现 这 一 过 程 ， 比 如 
SWISS-MODEL, MODELLER, PARMODEL, HHpre, MODBASE, 3D- 
JIGSAW, PROTEUS 和 ITASSER 等 。 得 到 的 推算 模型 还 需要 进行 评估 ， 
以 确定 其 优 劣 。Very3D 和 Procheck 是 两 种 最 为 常用 的 用 来 评估 结构 的 打 
分 函数 。 

随 着 同 源 建 模 方法 的 日 趋 成 熟 ， 运 用 一 些 自动 建 模 的 程序 也 可 以 得 到 很 
准确 的 蛋白 质 三 维 结构 。SWISS-MODEL 是 一 种 可 以 通过 ExPASy 服务 器 
的 Web 界面 (http: //swissmodel. expasy. org) 免费 访问 的 自动 化 蛋白 质 
同 源 建 模 服务 器 。 首 先 ，SWISS-MODEL 的 氨基 酸 序列 提交 方式 分 为 三 种 : 

(1) 简洁 模式 (first approach mode) 可 以 在 Web 界面 直接 贴 入 预测 
蛋白 质 的 氨基 酸 序列 或 是 Swiss-Prot/TrEMBL 编号 ， 然 后 服务 器 可 以 完全 
自动 地 建立 模型 。 用 户 也 可 以 指定 模板 结构 。 

(2) KERR (alignment mode) ”这 个 模式 需要 多 序列 联 配 的 方式 ， 
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用 户 需要 提供 一 条 目标 序列 和 一 条 模板 序列 。 

(3) 项 目 模式 (project mode) ”这 种 模式 适合 于 对 建 模 有 细节 要 求 的 用 
户 ， 此 模式 可 以 选择 不 同 的 模板 ,手工 编辑 目标 序列 和 模板 的 联 配 结果 ， 以 
便 判 断 插入 和 删除 的 位 置 。 项 目 模式 还 可 以 用 于 重复 改进 简洁 模式 的 结果 ， 
而 且 可 以 用 于 构建 复合 蛋白 的 模型 。 

SWISS-MODEL 的 结构 与 评估 ”SWISS-MODEL 将 通过 邮件 输出 模型 
的 坐标 ， 可 以 是 DeepView (是 一 种 整合 工具 ， 用 于 观察 和 分 析 蛋 白 的 结 
构 ) 项 目 文件 的 方式 或 者 是 普通 的 PDB 文件 格式 。 在 结果 的 日 志文 件 中 还 
包含 了 一 个 目标 模型 的 变异 参数 C-score， 当 模型 中 的 某 些 部 分 找 不 到 匹配 
的 模板 信息 时 ， 此 值 显示 为 99， 而 且 日 志文 件 还 记录 了 整个 结构 以 及 每 个 
残 基 的 力 场 能 量 ， 还 可 以 选择 在 结构 中 包含 一 份 蛋白 校 验 工 具 WhatCheck 
(http; //www. cmbi. kun. nl/gv/whatcheck) 的 报告 。 另 外 ， 也 可 以 利用 服 
务 器 上 的 ANOLEA 原子 平均 势能 的 Web 界面 (http: //swissmodel. ex- 
разу. org/anolea) 检查 模型 的 质量 。 


5.3 分 子 对 接 


分 子 对接 是 依据 配 体 与 受 体 “ 锁 - 钥 原 理 ”， 模 拟 小 分 子 配 体 与 受 体 生 物 
大 分 子 之 间 的 相互 作用 。 配 体 与 受 体 相互 作用 主要 包括 静电 作用 、 氢 键 作 
用 、 朴 水 作用 和 范 德 华 相互 作用 等 。 通 过 对 空间 匹配 和 能 量 匹配 的 计算 ， 预 
测 两 者 之 间 的 结合 模式 和 亲和力 ， 从 而 得 到 最 优 构象 。 其 中 空间 匹配 的 计 
算 ， 通 常 采用 格 点 计算 和 片段 生长 等 方法 ， 能 量 计算 则 使 用 人 工 神 经 网 络 、 
禁忌 搜索 、 局 部 搜索 、 模 拟 退 火 或 遗传 算法 等 方法 。 各 种 分 子 对 接 方法 对 体 
系 均 有 一 定 的 简化 ， 根 据 简化 的 程度 和 方式 ， 将 分 子 对 接 方法 分 为 三 类 : 刚 
性 对 接 ， 半 和 柔性 对 接 和 柔性 对 接 。 可 将 这 些 分 子 对 接 方 法 运用 于 小 分 子 药物 
的 虚拟 筛选 ， 或 分 子 动力 学 模拟 前 的 结构 准备 。 

目前 ， 文 献 报道 的 分 子 对 接 软件 很 多 ， 这 些 软件 中 很 多 都 是 由 实验 室 开 
发 ， 免 费 试用 ， 当 软件 逐渐 完善 没有 缺陷 时 ， 就 被 商业 公司 购买 ， 作 为 某 大 
型 软件 包 中 的 模块 。 当 然 ， 也 有 很 多 软件 依然 免费 提供 强大 的 服务 ， 甚 至 是 
源 代码 (source code) 。 所 以 ， 接 下 来 我 们 主要 介绍 几 款 免费 又 好 用 的 分 子 
对 接 软件 。 

(1) AutoDock 最 新 数据 显示 ，AutoDock 是 引用 文献 最 多 的 软件 ， 由 
Olson 科研 组 开发 并 向 外 提供 源 代码 的 免费 软件 (http: //autodock. 
scripps. edu/)。AutoDock 应 用 的 是 半 和 柔性 对 接 方 法 ， 人 允许 小 分 子 的 构象 发 
生变 化 ， 以 结合 自由 能 作为 评价 对 接 结果 的 标准 。 从 AutoDock3. 0 开始 采 
用 拉 马 克 遗 传 算法 (LGA)， 这 种 方法 将 遗传 算法 与 局 部 搜索 方法 相 结合 ， 
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先 用 遗传 算法 搜索 势能 面 ， 再 利用 局 部 搜索 精细 优化 势能 面 。 最 近 
AutoDock 又 开发 出 一 种 可 以 在 Windows 环境 下 运行 的 AutoDock-Vina 版 
本 ， 其 特点 是 速度 快 ， 与 AutoDock4. 0 相 比 更 具有 优势 。 

(2) DOCK 说 起 分 子 对 接 就 不 能 不 说 DOCK 这 款 软件 ， 它 也 是 以 源 代 
码 发 布 的 免费 软件 (http: //docking. org/)， 是 由 Kuntz 课题 组 开发 。DOCK 
应 用 半 和 柔性 对 接 法 ， 固 定 小 分 的 键 长 和 键 角 ， 将 小 分 子 拆 分 成 若干 刚性 片段 ， 
根据 受 体 的 表面 几何 性 质 ， 将 小 分 子 的 刚性 片段 重新 组 合 ， 进 行 构想 搜索 。 
同时 ， 考 虑 分 子 之 间 的 静电 相互 作用 、 范 德 华 力 等 非 键 相互 作用 ， 搜 索 势 能 
面 ， 最 终 用 能 量 评分 和 原子 接触 罚 分 之 和 对 对 接 结果 进 行 评价 。 

(3) Surflex-Dock | Surflex-Dock 是 对 学 术 用 户 免费 的 商业 软件 〈ht- 
tp: //www. biopharmics. com/products. html), ， 由 加 州 大 学 旧金山 分 校 
Ajay N. Jain 教授 开发 。 这 种 方法 的 评分 函数 来 自 于 已 知 的 结合 数据 ， 使 用 
阴性 训练 数据 以 减少 假 阳 性 结合 分 数 ， 还 可 以 进行 小 分 子 复合 物 的 倒 合 。 

(4) FlexX FlexX 是 另 一 种 运算 速度 超 快 的 分 子 对 接 软 件 ， 是 由 德国 
国家 信息 技术 研究 中 心 生 物 信息 学 算法 和 科学 计算 研究 室 开发 的 分 子 对 接 软 
件 (www. biosolveit. de/FlexX/)， 目 前 已 经 作为 分 子 设计 软件 包 Sybyl 的 
一 个 模块 实现 商业 化 。FlexX 使 用 碎片 生长 的 方法 寻找 最 佳 构 象 ， 根 据 对 接 
自由 能 的 数值 选择 最 佳 构象 。 

还 有 许多 其 他 的 对 接 软 件 ， 主 要 对 接 软件 列 于 表 5. 1， 在 此 就 不 一 一 介绍 
了 。 以 上 讲解 的 是 进行 大 分 子 与 小 分 子 对 接 的 软件 ， 还 有 一 些 软件 可 以 做 大 
分 子 之 间 的 分 子 对 接 工 作 ， 比 如 ESCHER, MONTY, HADDOCK, Z-DOCK 
和 HEX 等 软件 。 这 些 软件 还 在 进一步 改善 过 程 中 ， 所 以 我 们 不 作 过 多 介绍 。 


表 5.1 大 分 子 与 小 分 子 对 接 软件 列表 


软件 名 称 收费 形式 运算 速度 + 页 
AutoDock | 免费 —Rn http; //autodock. scripps. edu/ 
DOCK 免费 ж http: //docking. org/ 
3DDOCK | 免费 " http://www. bmm. icnet. uk/docking/ 
FRED 学 术 用 户 免费 1 年 快 http: //www. eyesopen. com/forms/eval_request. php 
Surflex-Dock | 学 术 用 户 免费 快 http: //www. biopharmics. com/products. html 
FlexX 收费 ,可 申请 6 周 试用 版 | OR http: //www. biosolveit. de/FlexX/ 
Glide 收费 一 般 http://www. schrodinger. com/products/14/5/ 
GOLD 收费 ж http://www. code. cam. ac. uk/products/life_sciences/gold/ 
ICM-Dock — | 收费 快 http://www. molsoft. com/index. html 
MVD 1 个 月 的 试用 期 ж http; //molegro. com/mvd-trial. php 


接 下 来 我 们 还 是 通过 实例 给 大 家 以 直观 的 印象 ， 进 一 步 了 解 如 何 使 用 这 
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些 软件 。AutoDock 作为 一 款 免 费 且 功能 强大 的 软件 深 受 科研 人 员 的 喜爱 ， 
所 以 我 们 以 AutoDock 为 例 ， 介 绍 分 子 对 接 的 整个 过 程 。 

AutoDock 对 接 过 程 主要 包括 以 下 几 个 步骤 : 准备 生物 大 分 子 受 体 一 创 
建 配 体 小 分 子 文件 一 准备 栅 格 图 一 设置 对 接 参 数 文件 一 运行 AutoGrid 和 
AutoDock 一 观察 对 接 结果 。 

а. 准备 目标 蛋白 ”用 pyMol 等 蛋白 分 析 软 件 打开 蛋白 的 PDB 文件， 这 
里 以 hsgl. pdb 为 例 ， 移 走 所 有 的 水 分 子 后 保存 。 在 AutoDockTool (ADT) 
中 ， 打 开 hsgl. pdb 文件 。 

File->Read Molecule 选择 hsgl. pdb 文件 。 

Edit Hydrogens-- Add 选择 “Polar only” “noBondOrder " “yes”, 加 
入 极 性 氢 离 子 。 

File-- Save Write PDB 保存 文件 。 

b. 创建 配 体 小 分 子 文件 

Ligand-Open:* (Арз) 打开 小 分 子 文件 。 

Display-*Show/Hide Molecule 将 macromolecule 隐藏 ， 放 大 Ligand, 

LigandTorsion Tree 一 Detect Root… 程 式 判 定 的 root 会 以 一 颗 绿 球 
表示 。 

Ligand—>Torsion Tree-Choose Torsions… 打 开 “Torsion Count” 对 话 
框 ， 选 择 哪 些 键 可 以 转动 ， 哪 些 键 不 可 以 转动 。 绿 色 代 表 可 以 转动 的 键 ， 红 
色 代 表 固 定 键 ， 粉 色 代 表 设 定 的 不 可 转动 的 键 。 

Ligand--Output--Save as PDBQ… (AD3) 保存 小 分 子 PDBQ 文件 命名 
为 “Ligand. pdbq”。 

c. 准备 栅 格 图 

Grid>Macromolecule 一 Choose… (Арз) fi "Select Molecule", % 
择 第 一 步 准 备 的 目标 蛋白 质 文件 并 储存 为 “Protein. раа”. 

Grid—>Set Map Types 一 Choose Ligand… (АРЗ) Select the ligand, 会 
跳出 一 个 “AutoFpf Ligand” 对 话 框 ， 点 击 “Accept”。 

Grid Box… 打 开 “Grid Options” 对 话 框 ， 可 以 调整 Grid Box 的 大 小 、 
grid points 之 间 的 距离 (Spacing) 和 中 心 位 置 (Center Grid Box) ， 调 整 完 
毕 后 关闭 对 话 框 : File>Close Saving Current. 

Grid—Output--Save GPF… (Арз) 保存 为 “Grid. gpf” 文 件 。 

d. 设置 对 接 参 数 文件 

Docking» Macromolecule— Set filename… (Арз) 选择 Protein. pdbq 
文件 。 

Docking--Ligand—Choose- (AD3) 选择 小 分 子 文件 “Ligand. pdbq”, 
同时 跳出 一 个 对 话 框 ， 无 需 修 改 ， 保 持 默 认 值 ， 点 击 “Accept”. 
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Docking—Search Parameters—Genetic Algorithme 选择 遗传 算法 。 

Docking—> Search Parameters 选择 包括 random number generator, random 
number generator seeds, the energy outside the grid 等 。 如 Number of runs>50; 
Population size->50; Maximum number of energy evaluations-*1500000; Transla- 
tion—0. 2; Quaternion—-5. 0; Torsion —5. 0; RMS Cluster Tolerance—1.5, 其 
他 值 保持 默认 值 。 

Docking 一 Output 一 Lamarckian GA… (AD3) 保存 这 个 对 接 文件 为 
“Dock. dpf”. 

е. 运行 AutoGrid 和 AutoDock 

autogrid3—>Grid. gpf-Grid. glg 并 运行 AutoGrid3, 

autodock3 一 Dock. dpf— Dock. dlg 并 运行 AutoDock3, 

f. 观察 对 接 结果 

可 以 通过 ADT 观察 对 接 结果 : 

Analyze->Dockings Open: 4] FF Dock. dlg 文件 ， 了 解 对 接 自由 能 的 
内 容 。 

Analyze—Macromolecule—Choose 加 载 目标 蛋白 分 子 。 

Select->Direct Select->Molecule List … 选择 大 分 子 。 

Color--by Atom Type 设置 蛋白 质 分 子 原子 的 颜色 。 

Compute~Molecular Surface Compute Molecular Surface 计算 大 分 子 
表面 。 

Analyze-*Conformations--Play … 观察 构象 。 

Analyze-*Clustering-* Show … 观察 构象 簇 。 

最 后 根据 构象 簇 的 情况 和 自由 能 大 小 来 判断 最 适宜 的 对 接 分 子 或 构象 ， 
以 达到 对 接 的 目的 。 


5.4 蛋白 结构 预测 与 分 子 对 接 在 生物 研究 中 的 应 用 


之 前 的 实例 分 别 利 用 一 种 分 子 模拟 方法 来 解决 某 一 方面 的 问题 ， 但 是 在 
很 多 情况 下 ， 例 如 刚刚 发 现 某 一 蛋白 ， 对 其 了 解 甚 少时 ， 就 需要 综合 使 用 多 
种 模拟 方法 ， 深 入 理解 这 一 蛋白 质 的 结构 和 功能 特性 。 所 以 我 们 以 H5N1 
高 致 病 性 禽 流 感 病毒 蛋白 的 分 子 模拟 为 例 ， 讲 解 蛋 白质 结构 预测 与 分 子 对 接 
在 蛋白 质 研究 中 的 综合 运用 。 

H5N1 是 一 种 高 毒 力 的 禽 流感 病毒 ， 它 可 以 大 规模 感染 禽类 ， 在 某 些 特 
殊 情况 下 还 可 以 感染 人 类 。 据 世界 卫生 组 织 (WHO) 统计, 在 2004 年 2 月 
到 2005 年 11 月 期 间 ， 禽 流感 病毒 已 经 传播 到 15 个 亚 欧 国家 。 由 于 在 此 项 
研究 报道 之 前 没有 任何 关于 HSN] 蛋白 质 晶体 结构 数据 可 以 利用 ， 但 又 急 
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需 解 决 H5N1 产生 的 耐 药 性 问题 ， 且 了 解 其 蛋白 酶 的 结构 与 活性 之 间 的 关 
系 ， 所 以 魏 冬 青 教授 等 采用 了 结构 生物 信息 学 的 方法 构建 了 HSNI-NA 的 三 
维 结构 ， 又 模拟 了 H5NI-NA 与 药物 分 子 对 接 过 程 ， 从 而 论证 了 HSN] 病 
毒 产 生 耐 药 性 的 原因 。 

(1) 构建 H5N1-NA 三 维 结构 “根据 同 源 建 模 的 原理 ， 通 过 序列 比 对 的 
方法 ， 运 用 PILEUP 程序 中 的 GCG 软件 包 ， 找 到 一 个 相似 度 为 47% 的 N9- 
NA (PDB code: 1F8B) 蛋白 作为 模板 〈 序 列 比 对 过 程 见 图 5.1)， 用 片段 
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图 5.1 序列 H5NI-NA (Accession No. Q5H89) 和 N9-NA 
(Accession No. Q84070) 比 对 ( 见 彩 图 ) 
图 中 氨基 酸 颜色 表示 氨基 酸 的 功能 : 酸性 一 红色 ; REE: 中 性 亲 水 一 粉红 色 ; 
脂肪 族 一 墨绿 色 ; 芳香 族 一 青绿 色 ; RUSSE KG. 亚 氨基 一 橙色 
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匹配 和 坐标 重建 的 方法 建立 起 H5N1-NA 的 三 维 结构 ， 如 图 5. 2。 从 图 中 可 
以 看 出 ， 两 个 蛋白 质 的 基本 骨架 午 合 得 很 好 ， 只 是 由 于 部 分 氨基 酸 片段 的 插 
人 与 删除 ， 使 得 Loop 结构 有 所 不 同 。 图 中 DANA 所 在 的 位 置 正 是 NA 的 
活性 口袋 ， 这 个 口袋 由 14 个 保守 的 带电 荷 的 氨基 酸 和 3 个 疏水 氨基 酸 组 成 。 
进一步 分 析 催化 口袋 与 小 分 子 底 物 是 如 何 结合 的 就 可 以 了 解 H5N1 的 耐 药 
性 是 如 何 产生 的 。 


图 5.2 根据 结合 DANA 的 N9-NA 复合 物 晶 体 结构 〈 红 色 ) 
构建 的 HSNI-NA 的 三 维 结构 CRE) ( 见 彩 图 ) 


(2) 配 体 与 受 体 的 结合 利用 “蒙特 卡 罗 模 拟 退 火 ”的 方法 搜索 小 分 子 
配 体 ， 如 DANA、 奥 塞 米 韦 和 扎 那 米 韦 等 〈 分 子 结构 见 图 5.3) 与 H5N1- 
NA 蛋白 结合 的 最 优 构 象 ， 结 果 如 图 5. 4 和 图 5. 5 所 示 。 与 NA 家 族 的 其 他 
蛋白 质 比较 发 现 ， 活 性 位 点 附近 的 氨基 酸 具有 一 定 的 保守 性 ， 但 是 与 N9- 
NA 蛋白 相 比 较 发 现 ，H5N1-NA 组 成 活性 位 点 的 氨基 酸 有 所 改变 ， 周 围 的 
亲 水 性 也 发 生 了 改变 ， 由 亲 脂 性 变 成 亲 水 性 。 可 能 正 是 由 于 这 样 的 改变 ， 所 
以 导致 H5N1 对 一 般 的 NA 抑制 剂 具有 耐 药 性 。 
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图 5.3 DANAY 扎 那 米 韦 和 奥 塞 米 韦 分 子 结构 
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(a) N9-NA:DANA (b) HSN1-NA:DANA 


图 5.4 ЖЖ DANA (红色 ) 分 别 与 受 体 N9-NA (a) 和 HSNI-NA (b) 
活性 位 点 残 基 E) 相互 作用 示意 图 MWER) 


图 5.5 N9-NA (a) 和 HSNI-NA (b) 活性 空 腔 的 亲 脂 和 亲 水 表面 示意 图 LBA) 
其 中 绿色 表示 亲 脂 性 ， 蓝 色 表 示 亲 水 性 


本 实例 通过 蛋白 质 预测 与 分 子 对 接 方法 的 联 用 ， 实 现 了 对 未 有 晶体 结构 
数据 参考 的 H5NI-NA 蛋白 质 结构 和 功能 的 研究 ， 并 从 分 子 模拟 的 角度 推测 
HSN1-NA 的 耐 药 性 产生 原因 ， 为 以 后 的 研究 打下 可 靠 的 理论 基础 。 


5.5 分 子 动力 学 模拟 在 蛋白 结构 变化 中 的 应 用 


分 子 动力 学 是 一 门 综合 物理 、 数 学 和 化 学 的 交叉 学 科 ， 它 以 起 始 构 型 为 
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模拟 基础 ， 赋 予 构成 分 子 的 各 个 原子 速度 ， 并 按照 分 子 瞬 时 的 运动 状态 ， 求 
解 这 些 原子 的 牛顿 运动 方程 ， 得 到 每 个 原子 新 的 位 置 和 速度 。 分 子 动力 学 模 
拟 可 以 作为 X 射 线 晶体 衍射 和 核磁 共振 等 实验 方法 测定 蛋白 质 空间 结构 的 一 
种 补充 。 这 种 方法 可 以 用 于 研究 蛋白 质 等 生物 大 分 子 体系 在 生理 环境 下 或 者 
其 他 特定 环境 下 的 空间 结构 变化 。 如 果 在 模拟 时 间 内 为 分 子 体系 选取 正确 的 
力 场 函数 形式 及 其 参数 ， 运 用 分 子 动力 学 就 可 以 准确 地 解析 分 子 运动 性 质 。 
分 子 动力 学 这 门 学 科 已 有 很 久 的 发 展 历史 ， 早 在 1957 年 Alderand 等 就 
提出 了 基于 钢 球 势 的 分 子 动力 学 法 。 但 是 由 于 计算 资源 的 限制 ， 最 近 几 十 年 
才 将 分 子 动力 学 广泛 应 用 于 生物 大 分 子 的 研究 中 ， 并 取得 了 令 世 人 瞩目 的 成 
就 。 分 子 动力 学 为 分 子 模拟 提供 了 许多 的 帮助 。 运 用 图 形 与 分 子 模型 交互 ， 
可 在 计算 机 屏幕 上 以 图 形 的 形式 表示 出 分 子 动力 学 的 轨迹 数据 ， 观 察 、 比 较 
和 分 析 分 子 各 个 构象 式 的 三 维 立 体 结构 ， 用 以 推测 和 评价 生物 大 分 子 的 构象 
变化 或 药物 与 受 体 相互 作用 的 分 子 形式 。 本 节 以 T1 脂肪 酶 的 分 子 动力 学 模 
拟 研 究 为 实例 ， 向 大 家 展示 分 子 动力 学 模拟 在 分 析 生 物 大 分 子 结构 特点 及 分 
子 结构 变化 中 的 应 用 。 


5.5.1 研究 背景 


T1 脂肪 酶 是 从 马来西亚 的 Geobacillus zalihae 菌株 中 分 离 出 来 的 一 种 
分 泌 于 细胞 外 的 恒温 叹 碱 酶 。 在 温度 的 
诱导 下 ， 酶 的 分 子 结构 开始 改变 ， 在 大 
约 70C 时 ， 此 酶 具有 很 高 的 活性 ， 将 长 
链 的 甘油 三 酯 催化 水 解 为 脂肪 酸 和 甘油 。 
T1 脂肪 酶 含有 经 典 的 催化 三 联 体 Ser- 
His-Asp 结构 ， 整 个 蛋白 骨架 由 7 Ж В 
VER 13 个 a 螺旋 、10 个 3io 单 环 及 
Loop 包围 成 球形 〈 见 图 5.6)， 实 验证 
明 ， 酶 的 活性 位 点 埋 在 分 子 里 面 。 分 子 
动力 学 模拟 Т1 脂肪 酶 的 目的 就 是 从 微 
观 角度 阐述 Tl 脂肪 酶 在 各 个 温度 下 结 
图 5.6 Tl 脂肪 酶 的 分 子 结构 构 的 变化 ， 以 及 分 子 水 平 的 催化 机 理 。 


5.5.2 实验 方法 


以 TI 脂肪 酶 的 晶体 结构 (PDB code: 2dsn) 为 初始 模型 ， 运 用 GRO- 
MACS 3. 3. 3 软件 包 进行 分 子 动力 学 模拟 。 选 用 GROMOS 53a6 作为 整个 蛋 
白 的 力 场 ， 设 置 周期 性 边界 条 件 。 将 蛋白 放 入 8. 5nm X 8. 5nmX8. 5nm 大 小 
的 盒子 中 ， 并 加 入 SPC216 型 的 水 分 子 。 加 入 6 个 钠 离子 使 整个 体系 达到 离 
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子平 衡 后 ， 进 行 1000 步 的 能 量 最 小 化 模拟 。 最 后 分 别 在 30°С, 60°C, 70°C 
和 100C 温 度 条 件 下 ， 完 成 30ns 的 分 子 动力 学 模拟 。 在 模拟 过 程 中 ， 运 用 
LINear Constraint Solver (LINCS) 算法 计算 键 约束 ; PME 算法 来 计算 体系 
中 的 静电 势能 ; 设 定 范 德 华 势能 计算 中 的 CUTOFF 为 12A。 体 系 坐 标 每 隔 
Ips 记录 一 次 ， 但 分 子 动力 学 模拟 的 时 间 步 长 为 2fs。 


5.5.3 实验 结果 


通过 分 析 分 析 动 力学 模拟 TI 脂肪 酶 运动 的 轨迹 ， 我 们 发 现 Tl 脂肪 酶 
在 低温 (30°C) 环境 下 很 不 稳定 ， 计 算 轨 迹 与 初始 结构 间 Ca 的 均 方 根 偏差 
(RMSD) 来 判断 系统 是 否 收敛 及 结构 变化 程度 ， 结 果 见 图 5.7，30'C 时 
RMSD 值 较 高 且 收 敛 得 很 慢 ， 且 Ca 的 回转 半径 值 〈 见 图 5.8) 明显 高 于 其 
他 温度 。 相 反 ，T1 脂肪 酶 在 较 高 温度 下 (70°С), Ca 的 均 方 根 偏差 
(RMSD) 值 收敛 得 快 且 低 于 其 他 温度 ,证 明 此 酶 在 70C 条 件 下 结构 较 稳 
定 ， 有 利于 催化 底 物 。 


0 5000 10000 15000 20000 25000 30000 
时 间 /ps 
图 5.7 模拟 过 程 中 骨架 碳 原子 的 均 方 根 偏差 随时 间 变 化 示意 图 〈 见 彩 图 ) 


用 蛋白 质 结构 可 视 化 软件 ОШ VMD，PyMOL 等 ) 仔细 观察 T1 脂肪 酶 
在 各 个 温度 条 件 下 的 结构 变化 ， 我 们 发 现 活性 位 点 Ѕег112 的 上 方 有 两 个 螺 
旋 结 构 的 运动 有 一 定 的 规律 ， 所 以 我 们 计算 这 两 个 螺旋 -螺旋 6 (Asp175- 
Alal90) 和 螺旋 9 (Val294-Ser301) 在 30ns 的 模拟 过 程 中 距离 的 变化 〈 见 
图 5. 9)。 由 图 可 知 ，30C 时， 两 个 螺旋 之 间 的 距离 变化 较 大 ， 距 离 最 远 可 
以 达到 4. 9nm， 最 近 是 2nm。 这 两 个 时 刻 蛋 白 的 结构 如 图 5. 10 所 示 ， 分 别 
呈现 打开 和 闭合 的 结构 。 而 在 70C 时 ， 两 个 螺旋 之 间 的 距离 虽 也 有 波动 ， 
但 是 波动 幅度 明显 比 30C 小 ， 且 在 10ns ЦБ, ТІ 脂肪 酶 的 打开 构象 更 为 
稳定 。 如 果 与 底 物 结合 ， 那 么 在 70C 时 ， 底 物 与 酶 之 间 的 结合 时 间 相 对 于 
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回转 半径 /nm 


0 5000 10000 15000 20000 25000 30000 
时 间 /ps 


图 5.8 骨架 碳 原子 的 回转 半径 示意 图 〈 见 彩 图 ) 


0 5000 10000 15000 20000 25000 30000 
时 间 /ps 
图 5.9 模拟 过 程 中 螺旋 6 与 螺旋 9 之 间 的 距离 〈 见 彩 图 ) 
其 他 温度 就 会 更 长 。 


为 了 进一步 了 解 Т1 脂肪 酶 是 如 何 通 过 温度 调节 催化 活性 的 分 子 机 理 ， 
我 们 计算 整个 模拟 过 程 中 ， 各 温度 下 ， 活 性 中 心 附近 БА 以 内 的 水 分 子 个 数 
[ 见 图 5. 11(a)]。 通 过 计算 平均 值 ， 我 们 发 现在 70C 时 ， 活 性 中 心 附近 的 水 
ЯА, 60°C 的 标准 偏差 最 小 ， 这 就 是 为 什么 70C 时 TI 脂肪 酶 的 活性 最 
高 ，60C 脂 肪 酶 的 活性 最 稳定 。 我 们 再 将 70C 时 的 活性 中 心 附近 水 分 子 数 ， 
与 两 个 螺旋 之 间 的 距离 随时 间 变 化 值 进 行 比较 [ 见 图 5. 11(b)]， 发 现 它们 
的 波动 趋势 基本 一 致 ， 证 明 这 两 个 螺旋 组 成 了 T1 脂肪 酶 的 活性 口袋 ,它们 
的 运动 直接 影响 到 ТІ 脂肪 酶 的 活性 。 

同时 我 们 还 分 析 了 组 成 螺旋 6 和 螺旋 9 的 氨基 酸 的 朴 水 性 ， 发 现 螺旋 9 
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图 5.10 MD 模拟 中 TI 脂肪 酶 打开 (а) 与 关闭 b) 的 构象 (LBA) 
红色 代表 螺旋 9， 蓝 色 代表 螺旋 6， 绿 色 代表 活性 中 心 
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图 5.11 不 同 温度 下 活性 中 心 附 近 水 分 子 统计 数据 
Са) 各 温度 下 活性 位 点 水 分 子平 均值 与 标准 方差 ， 
(b) 70 必 两 个 螺旋 距离 与 活性 中 心 水 分 子 数 之 间 的 关系 


是 一 个 朴 水 螺旋 ， 而 螺旋 6 是 一 个 半 朴 水 螺旋 ， 它 靠近 活性 中 心 的 一 半 是 由 
朴 水 氨基 酸 组 成 ， 而 靠近 溶剂 的 一 面 是 由 亲 水 氨基 酸 组 成 〈 见 图 5. 12) 。 由 
此 我 们 推测 ， 分 子 之 间 的 朴 水 相互 作用 是 导致 螺旋 运动 的 主要 作用 力 。 在 水 
溶液 中 ， 螺 旋 6 的 亲 水 部 分 为 脂肪 酶 提供 足够 的 能 量 ， 将 活性 口袋 打开 ， 使 
底 物 进入 口袋 与 活性 中 心 结合 ， 催 化 水 解 底 物 。 


5.5.4 结论 


我 们 通过 分 子 动力 学 模拟 的 方法 ， 了 解 T1 脂肪 酶 分 子 在 不 同 温度 条 件 
下 的 结构 变化 ， 从 而 解释 了 为 什么 T1 脂肪 酶 在 不 同 温度 下 的 催化 活性 不 
同 。 提 出 了 一 种 双 盖 子 运动 的 模型 ， 揭 示 了 Т 脂肪 酶 的 催化 机 理 ， 为 酶 的 
设计 提供 了 理论 基础 。 
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(а) 


Р 5.12 Tl 脂肪 酶 结构 变化 的 分 子 机 理 示 意图 〈 见 彩 图 ) 
红色 代表 疏水 ， 蓝 色 代表 亲 水 


5.6 分 子 动力 学 模拟 研究 氨基 酸 突变 对 蛋白 结构 的 影响 


利用 分 子 动力 学 模拟 的 方法 还 可 以 研究 蛋白 质 某 一 位 点 的 氨基 酸 突变 
后 ， 导 致 蛋白 质 结构 和 功能 的 变化 。 这 里 我 们 以 GTP 结合 蛋白 Rab5a 的 分 
子 模 拟 研究 为 例 ， 了 解 具体 的 实验 步骤 和 如 何 分 析 模拟 得 到 的 分 子 动力 学 轨 
迹 数据 。 


5.6.1 研究 背景 


GTP 结合 蛋白 可 以 被 称 为 鸟 苷 酸 结合 蛋白 或 者 G 蛋白 。 这 类 蛋白 质 是 
一 类 非常 重要 的 信号 转 导 因子 。Rab5a 是 GTP 结合 蛋白 Rab 家 族 的 重要 一 
员 。 这 种 蛋白 质 主要 是 负责 调控 细胞 内 吞 作用 中 内 涵 体 的 熔 合 。Rab5a 的 空 
间 结 构 接近 球形 ， 主 要 由 a 螺旋 和 B 片 层 相 互 折 释 围 绕 而 成 ， 如 图 5. 13 所 
示 。 目 前 已 发 现 N 端 区 的 主要 功能 结构 域 有 P 环 、 开 关 区 工 和 开关 区 工 。 
Rab5a 的 P 环 序列 由 27GESAVGKS34 组 成 ， 已 知 此 部 位 突变 可 引起 Rab5a 
的 GTP 水 解 能 力 、 结 合 能 力 和 生物 活性 改变 。 开 关 区 工 和 开关 区 I Æ 
Rab5a 蛋白 的 核 苷 酸 结 合 位 点 ， 分 别 包 括 第 49 一 51、79 一 81 氨基 酸 残 基 。 
在 与 GTP 结合 时 ， 两 个 开关 区 域 形 成 一 个 有 序 而 广泛 的 朴 水 表面 ， 而 在 与 
GDP 结合 时 ， 则 表现 出 一 种 移 位 的 、 活 动 的 开关 区 域 。Rab5a 的 中 间 区 域 
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是 与 其 他 Rab 蛋白 高 度 同 源 的 保守 序 
列 ， 也 是 Rab5a 与 其 辅助 蛋白 和 效应 
蛋白 相互 作用 的 部 位 ， 并 参与 GDP 和 LL. 
GTP 的 结合 。 RAN 


5.6.2 方法 介绍 


5.6.2.1 初始 结构 的 准备 
此 研究 选取 了 四 个 不 同 的 体系 
来 进行 Rab5a 的 分 子 动力 学 模拟 。 
研究 人 员 首 先 从 蛋白 质 三 级 结构 数 
据 库 PDB 中 提取 了 1N6H. pdb 和 图 5.13 GTP 结合 蛋白 Rab5a 
1N6L. pdb 两 个 文件 ， 分 别 作为 野生 的 空间 结构 示意 图 
型 Rab5a 和 它 的 A30P 突变 与 GTP 分 子 形成 的 复合 物体 系 。 这 说 明 实 验 
的 初始 结构 是 通过 真实 实验 获得 的 分 辩 率 分 别 为 1. 51A 和 1. 60A 的 晶 
体 结构 。 此 外 ， 还 将 这 两 个 复合 物体 系 中 的 GTP 分 子 删除 ， 从 而 形成 
两 个 新 的 体系 ， 即 野生 型 Rab5a MEM АЗОР 突变 蛋白 体系 。 然 后 将 晶 
体 结构 中 的 其 他 杂 原 子 和 水 分 子 都 删除 ， 最 后 得 到 四 种 体系 的 初始 结构 
模型 。 


5.6.2.2 模拟 方法 与 参数 设置 

分 子 动力 学 模拟 是 利用 AMBERS. 0 软件 来 实现 的 。 用 AMBER 软件 进 
行动 力学 模拟 时 ， 一 般 都 要 经 过 分 子 体系 拓扑 文件 的 准备 、 能 量 最 小 化 、 平 
衡 系统 、 体 系 升温 和 运行 真正 的 动力 学 模拟 等 过 程 ， 以 下 是 具体 操作 。 首 先 
在 模拟 中 ， 加 入 了 边界 性 周期 条 件 和 Amber 的 蛋白 质 力 场 参数 。 利 用 AM- 
BERS. 0 软件 中 的 t-leap 软件 包 生成 各 个 体系 中 的 所 有 原子 的 拓扑 结构 、 坐 
标 以 及 添加 电荷 ， 并 且 在 开始 分 子 动力 学 模拟 之 前 ， 各 体系 的 晶体 结构 会 被 
放 入 到 充满 TIPS 水 分 子 的 模拟 盒子 中 ,盒子 的 边缘 距离 蛋白 质 的 表面 
1. 0nm。 紧 接着 ， 进 行 能 量 最 小 化 ， 直 到 体系 能 量 的 容 差 达 到 100kJ/mol 为 
lE. 然后， 体系 中 所 有 的 原子 会 在 310K 的 温度 下 平衡 一 段 时 间 。 在 这 段 时 
间 内 ， 蛋 白质 的 骨架 结构 是 固定 的 ， 以 防止 其 三 级 结构 被 破坏 。 平衡 好 之 
后 ,体系 将 会 被 逐渐 放松 ， 并 且 一 点 点 地 从 OC 加 热 到 37C， 最 终 实 现 
lOns 的 分 子 动力 学 模拟 。 在 模拟 中 ， 始 终 保 持 常温 和 常 压 ， 其 耦合 常数 分 
别 为 0. lps 和 1. 0ps。 对 于 溶剂 水 分 子 来 说 ， 其 等 温 压 缩 率 设 定 为 4. 5 х 
10 5/bar9。 此 外 ， 体 系 中 的 静电 势能 是 利用 PME 算法 来 计算 的 ; 范 德 华 
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势能 计算 中 的 CUTOFF 被 设 定 为 12A。 所 有 的 分 子 动力 学 模拟 的 时 间 步 长 
为 2fs， 而 体系 坐标 则 是 每 隔 lps 记录 一 次 。 


5.6.3 实验 结果 与 分 析 


分 子 动力 学 模拟 轨迹 分 析 。 通 常 来 说 ,分 子 动力 学 模拟 中 只 有 在 体 
系 达 到 动态 平衡 之 后 的 构象 才 具 有 采集 的 价值 ， 并 且 可 以 被 应 用 于 后 续 
的 分 析 中 。 可 以 用 体系 的 总 能 量 和 均 方 根 偏差 (RMSD) 来 作为 衡量 是 
否 达 到 动态 平衡 的 标准 ， 同 时 ， 均 方 根 偏差 还 可 以 作为 衡量 体系 是 否 收 
敛 的 标准 。 如 图 5.14 所 示 ， 四 个 体系 在 模拟 的 过 程 中 ， 系 统 的 总 能 量 
基本 上 保持 平稳 。 而 且 在 结合 了 小 分 子 GTP 之 后 ， 野 生 型 和 突变 型 蛋 
白 体 系 的 总 能 量 明显 降低 ， 这 说 明 GTP 分 子 的 结合 可 以 稳定 体系 。 此 
外 ， 在 没有 结合 GTP 时 ， 野 生 型 和 突变 型 蛋白 体系 的 总 能 量 相差 较 大 ， 
随 着 GTP 分 子 的 结合 ， 这 种 差距 明显 减 小 。 同 时 ， 如 图 5.14 所 示 ， 在 
lons 的 分 子 动力 学 模拟 过 程 中 ， 结 合 有 小 分 子 GTP 的 体系 其 均 方 根 偏 
差 要 略 高 于 没有 结合 小 分 子 的 体系 。 这 说 明 ， 小 分 子 的 结合 可 以 增强 蛋 
白质 的 柔韧 性 。 


总 能 量 /(WJ/mol) 


А 00 
01235456759: 10 012345 6 7T 8 9 10 
时 间 /ns 时 间 /ns 


图 5.14 模拟 过 程 中 体系 总 能 量 和 骨架 碳 原子 的 均 方 根 偏差 随时 间 变 化 示意 图 〈 见 彩 图 ) 


再 通过 观察 10ns 的 分 子 动力 学 模拟 过 程 中 蛋白 质 骨 架 碳 原子 的 均 方 根 
波动 的 示意 图 (图 5. 15) ， 可 以 发 现 四 个 体系 蛋白 质 骨 架 碳 原子 的 均 方 根 波 
动 是 相似 的 ， 但 是 在 10-20、30-45、50-60、65-80、110-120 和 140-150 这 些 
氨基 酸 残 基 区 域 ， 四 种 体系 的 骨架 碳 原子 均 方 根 波动 有 着 明显 差异 。 这 些 区 域 
主要 集中 在 PH 〈Gly27-Ser34)、 开 关 I 区 (Gln49-Ala56) #11 〈Ala77- 
Leu85) 。 

在 P 环 区 域 ， 蛋 白质 骨架 碳 原子 的 均 方 根 偏差 〈 见 表 5.2)， 结 合 了 
GTP 分 子 的 两 个 体系 要 明显 低 于 没有 结合 任何 小 分 子 的 体系 。 这 说 明 ， 
GTP 的 结合 可 以 降低 P 环 区 域 的 结构 柔韧 性 ， 也 就 是 说 GTP 分 子 的 结合 可 
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图 5.15 分 子 动力 学 过 程 中 骨架 碳 原子 的 
均 方 根 波动 示意 图 ( 见 彩 图 ) 


以 有 效 减 少 突变 所 带 来 的 结构 差异 。 如 图 5. 16 所 示 。 在 了 环 区 域 由 突变 所 


带 来 的 结构 变化 主要 集中 在 Ser29 和 Ala30/Pro30 这 两 个 氨基 酸 残 基 上 。 
表 5.2 四 个 体系 中 各 个 部 分 的 均 方 根 偏差 的 平均 值 列表 
体系 名 称 蛋白 整体 P 环 A30/P30 Res. 49 - 51 
wr 1.30 + 0.21 0.52 + 0.11 0.08 + 0.02 1.23 + 0.30 
АЗОР 1.25 + 0.18 0.54 + 0.10 0.04 + 0.02 1.03 + 0.29 
WT-GTP 1.71 + 0.31 0.36 + 0.07 0.03 + 0.01 0.87 + 0.21 
A30P-GTP 1.54 + 0.25 0.38 + 0.08 0.03 + 0.01 0.85 + 0.21 
FREI 
PH E49, 
Q48 F47 
S5 
Q79 
GTP Mg, 
GTP E46 
G78 
$29 
开关 区 I A30/P30 
FREI 
\. rer 


图 5.16 АЗОР 突变 所 带 来 的 结构 变化 示意 图 ( 见 彩 图 ) 
图 中 野生 型 结构 用 蓝 色 棍 状 模型 表示 ， 而 突变 型 结构 则 是 用 红色 棍 状 模型 表示 


氢 键 在 受 体 与 配 体 相互 结合 的 过 程 中 发 挥 着 非常 重要 的 作用 ， 研 究 结合 
位 点 上 的 氨基 酸 与 配 体 间 的 距离 可 以 反映 受 体 与 配 体 之 间 是 否 发 生 相互 作 


。 因 此 通过 追踪 30 位 置 上 氨基 酸 残 基 骨 架 氮 原子 与 GTP 分 子 的 B-y BRE 
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氧 原子 之 间 的 距离 ， 如 图 5. 17 所 示 ， 研 究 者 发 现 Pro30 的 骨架 所 原子 不 能 
与 GTP 分 子 的 В-у 桥 连 氧 原子 形成 氢 键 相互 作用 。 而 通过 NMR KREK, 
野生 型 蛋白 质 中 Ala30 的 骨架 氮 原子 与 GTP 分 子 的 B-y 桥 连 氧 原子 所 形成 的 
氢 键 相互 作用 在 GTP 结合 蛋白 质 中 对 于 催化 GTP 水 解 有 着 重要 的 作用 。 同 
时 ，30 位 氨基 酸 残 基 上 的 骨架 氮 原 子 能 够 稳定 催化 过 程 中 积累 的 负电 荷 。 
由 此 可 见 , 第 30 位 氨基 酸 残 基 的 突变 可 以 使 GTP 结合 蛋白 失去 其 生物 学 
活性 。 


"——Wi-ciP 
A30P-GTP} 


时 间 /ns 
图 5.17 第 30 位 氨基 酸 骨 架 氨 原 子 与 GTP 分 子 B-Y 桥 连 氧 原子 之 间 的 距离 


同样 的 均 方 根 偏差 变化 也 发 生 在 开关 工区 域 。 此 外 ， 通 过 追踪 GTP 分 
子 与 周围 水 分 子 的 距离 ， 发 现 这 些 在 开关 工区 域 的 结构 变化 是 由 第 30 {у Ж 
变 所 带 来 的 P 环 区 域 和 开关 工区 域 之 间 的 水 分 子 重 排 所 导致 的 。 在 野生 型 
蛋白 质 体系 中 ，GTP 分 子 中 磷酸 根基 团 上 的 3 个 氧 原子 可 以 分 别 与 1 个 水 分 
子 、Thr38 和 Cln65 形成 所 键 相互 作用 ;而 另 一 个 水 分 子 则 可 以 与 镁 离子 形 
成 配 位 键 。 但 是 在 АЗОР 突变 型 中 ， 由 于 Ѕег15 和 Lys19 侧 链 基 团 的 相互 接 
触 ， 使 得 上 述 的 水 分 子 不 能 与 GTP 分 子 形成 氢 键 相互 作用 。 

研究 者 还 定义 了 第 30 位 氨基 酸 残 基 与 49 位 至 52 位 氨基 酸 残 基 之 间 的 
距离 为 GTP 结合 蛋白 Rab5a 结合 СТР 口袋 的 直径 。 通 过 测算 这 一 距离 ， 如 
图 5.18 所 示 ， 可 以 发 现 ， 这 一 水 分 子 重 排 能 够 通过 其 与 49 位 至 52 位 氨基 
酸 残 基 以 及 GTP 分 子 的 相互 作用 来 实现 蛋白 质 的 结构 变化 ， 使 得 GTP 结合 
蛋白 Rab5a 结合 СТР 口袋 张 开 ， 更 加 有 利于 GTP 分 子 的 结合 。 


4 结论 


通过 以 野生 型 和 A30P 突变 型 CTP 结合 蛋白 Rab5a 以 及 它们 与 GTP 分 
子 所 形成 的 复合 物 为 研究 对 象 ， 通 过 10ns 的 分 子 动力 学 模拟 研究 GTP 结合 
蛋白 Rab5a 的 结构 波动 ， 以 及 其 了 环 、 分 子 开关 工区 和 分 子 开关 开 区 的 重 
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图 5.18 第 30 位 氨基 酸 残 基 与 49 位 至 52 位 氨基 酸 残 基 之 间 的 距离 


要 结构 变化 。 研 究 者 发 现在 Р 环 和 分 子 开关 工区 ，GTP 分 子 的 结合 可 以 缩 
小 甚至 消除 第 30 位 氨基 酸 突变 所 带 来 的 结构 变化 ， 使 两 者 的 结构 波动 趋 于 
相似 。GTP 分 子 的 这 一 作用 是 通过 诱导 该 区 域 水 分 子 重 排 来 实现 的 。 此 外 ， 
由 于 在 第 30 位 进行 了 突变 ， 使 得 突变 型 蛋白 的 第 30 位 氨基 酸 残 基 不 能 与 
GTP 的 В-У 桥 连 氧 原子 形成 氢 键 。 而 这 个 氢 键 被 认为 是 GTP 结合 蛋白 中 催 
化 GTP 水 解 的 关键 所 在 ， 如 果 失 去 这 个 氢 键 ， 将 导致 蛋白 质 生 物 学 活性 的 
消失 。 

通过 这 个 实例 让 我 们 了 解 ， 如 何 运用 分 子 动力 学 模拟 方法 ， 研 究 蛋白 关 
键 位 点 的 氨基 酸 突变 对 蛋白 结构 和 功能 的 影响 ， 而 且 证 明了 分 子 动力 学 模拟 
方法 对 于 解决 此 类 问题 的 有 效 性 。 


5.7 区 标 蛋白 与 抑制 剂 的 相互 作用 研究 


分 子 动力 学 模拟 方法 不 仅 可 以 用 于 研究 单独 的 蛋白 质 分 子 ， 而 且 还 可 以 
研究 蛋白 质 与 小 分 子 之 间 的 相互 作用 ， 了 解 其 分 子 机 制 ， 为 实际 操作 提供 理 
论 依据 。 现 在 许多 科学 家 将 分 子 动力 学 模拟 运用 到 药物 设计 方面 ， 研 究 蛋 白 
酶 与 其 抑制 剂 之 间 的 相互 作用 ， 找 出 病毒 产生 耐 药 性 的 原因 ， 为 设计 更 高 效 
的 抑制 剂 提供 帮助 。 所 以 我 们 以 HIV 耐 药性 分 子 模拟 为 例 ， 看 看 分 子 动力 
学 模拟 到 底 给 药物 设计 提供 了 怎样 的 帮助 。 


5.7.1 研究 背景 


艾滋 病 的 医学 全 名 为 “获得 性 免疫 缺陷 综合 征 ”， 它 是 由 人 体 免疫 缺陷 
病毒 (HIV) 引起 的 。HIV 属于 逆转 录 病 毒 系 慢 病毒 亚 科 ， 潜 伏 期 较 长 ， 
免疫 系统 的 细胞 为 主要 感染 对 象 ， 如 T ARAE AE. HIVA IAA П 
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型 两 种 ， 两 者 又 分 别 有 许 多 亚 型 。HIV-I 的 致 病 力 强 ， 是 引起 全 球 艾 滋 病 
流行 的 主要 病源 。 随 着 对 HIV 病毒 学 及 分 子 生物 学 等 方面 的 研究 ， 人 们 逐 
渐 认 识 到 HIV 蛋白 酶 是 一 种 对 于 该 病毒 复制 周期 正常 运转 和 病毒 粒 的 成 熟 、 
变 得 有 感染 能 力 至 关 重 要 的 酶 。 抑 制 了 HIV 蛋白 酶 的 活性 或 将 此 酶 的 活性 
降低 到 极 低 水 平 ，HIV 在 被 感染 的 细胞 中 就 会 产生 不 成 熟 的 、 没 有 感染 性 
的 病毒 颗粒 ， 从 而 使 得 病毒 不 能 正常 装配 。 因 此 ，HIV- 工 蛋白 酶 是 病毒 成 
熟 所 不 可 或 缺 的 ， 这 使 其 成 为 抗 HIV/AIDS 药物 的 一 个 重要 靶 酶 。 

HIV- 工 蛋白 酶 属于 天 冬 氨 酰基 蛋白 酶 家 族 ， 它 有 天 冬 氨 酰基 蛋白 酶 共 
有 的 DTG 活性 序列 。HIV 蛋白 酶 的 三 维 结构 显示 出 它 是 由 两 条 含 99 个 氨 
基 酸 的 多 肽 链 形成 的 C2 对 称 的 均 二 聚 体 。 活 性 部 位 是 由 Asp25/25'-Thr26/ 
26'-Gly27/27' 组 成 的 ，Asp25/25' 在 催化 中 起 着 关键 的 作用 。HIV- 工 蛋白 酶 
的 活性 位 点 位 于 一 个 狭长 的 “通道 ”的 底部 ， 当 与 抑制 剂 结合 以 后 ， 和 蛋白酶 
的 结构 ， 尤 其 是 挡 板 区 (Шар) 的 结构 将 发 生 很 大 的 变化 。 通 道 位 于 二 聚 体 
之 间 的 接触 面 上 ， 通 道 的 长 度 约 为 2. 3nm。HIV- 了 I 蛋白酶 具有 二 重 对 称 性 ， 
对 称 轴 位 于 两 个 催化 天 冬 氨 酸 的 中 间 。 从 两 个 天 冬 氨 酸 的 中 间 开始 ， 两 侧 分 
别 排 列 着 S1、S2、S3 和 51', S2, SS WALA. 

HIV 典型 遗传 特征 之 一 是 高 度 遗 传 变异 性 。 据 报道 ， 在 HIV-I RAM 
单个 亚 基 的 99 个 氨基 酸 位 点 中 ， 至 少 有 49 个 位 点 发 生 了 超过 87 种 突变 ， 
这 其 中 很 多 位 点 的 突变 已 被 证 实 与 HIV 病毒 对 一 种 或 多 种 蛋白 酶 抑制 剂 产 
生 抗 性 相关 。 因 此 ， 我 们 所 介绍 的 研究 采用 了 B 亚 型 野生 型 (Bwt), FE 
型 野生 型 (Еш) 以 及 2 种 来 自 巴 西 抗 艾滋 病 失 败 疗 法 病 患 体内 的 HIV- I 
蛋白 酶 突变 体 B 亚 型 突变 型 (Втш), Е 亚 型 突变 型 (Ети) 四 种 蛋白 酶 
与 抑制 剂 TL-3 分 子 的 晶体 结构 为 研究 对 象 ， 其 对 应 的 PDB ID code 分 别 
A: Bwt—2P3B, Bmut—2P3A, Fwt—2P3C, Fmut—2P3D. Ж ШЖ Е 
们 结构 上 的 差异 ,来 寻找 产生 耐 药 性 的 根源 。 


5.7.2 实验 方法 


分 子 动力 学 模拟 以 及 模拟 前 的 能 量 最 小 化 都 是 使 用 AMBERS. 0 模拟 软 
件 包 。 各 蛋白酶 的 力 场 参 数 使 用 的 是 parm99 力 场 ， 而 小 分 子 抑制 剂 的 力 场 
通过 AMBERS. 0 中 的 Antechamber 程序 进行 构建 。 初 始 坐 标 提取 自 PDB 
晶体 结构 ，H 原子 通过 AMBER8. 0 的 LEAP 模块 加 入 。 在 蛋白 酶 与 抑制 剂 
复合 物 周 围 加 有 6 个 氯 离子 以 保持 体系 的 电 中 性 。 使 用 SHAKE 算法 进行 键 
约束 计算 (包括 H 原子 )。 将 复合 物质 心 置 于 截 项 八 面体 盒子 中 心 ， 选 择 溶 
质 原子 到 盒子 壁 的 距离 至 少 为 10A， 然 后 加 入 水 分 子 ， 水 分 子 采 用 TIP3P 
模型 。 接 着 ， 采 用 AMBERS. 0 的 PMEMD 模块 ， 以 最 陡 下 降 法 对 复合 物 进 
行 了 1000 步 的 体系 能 量 最 小 化 。 然 后 将 体系 在 300K 温度 下 平衡 20ps。 最 
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后 在 298K 下 进行 了 10ns 的 分 子 动力 学 模拟 。 运 动 方程 积分 步 长 HAE 
长 ) 取 2fs， 每 隔 1ps 记录 一 次 坐标 文件 ， 以 用 于 后 续 的 分 析 。 在 分 子 动力 
学 模拟 中 ， 长 程 静电 相互 作用 采用 Particle Mesh Ewald (PME) 算法 。 

氨 键 及 玖 水 相互 作用 的 定义 : 如 果 两 个 重 原子 为 氢 的 供 体 和 受 体 ， 那 么 
它们 之 间 的 距离 在 3. 5A 之 内 就 被 认为 是 有 可 能 存在 氢 键 相互 作用 ; RE 
白质 中 的 某 个 疏水 基 团 距离 抑制 剂 分 子 6. 5A 之 内 ， 就 认为 它们 之 间 存 在 某 
种 朴 水 相互 作用 。 


5.7.3 体系 分 子 动力 学 轨迹 分 析 


抑制 剂 TL-3 与 各 种 蛋白 酶 的 复合 物体 系 在 平衡 20ps 后 分 别 进行 了 
10ns 的 分 子 动力 学 模拟 。 通 过 观察 各 体系 的 RMSD fff CA 5. 19) RR, 
四 个 体系 的 RMSD 的 变化 范围 小 于 3. 0A， 各 体系 在 模拟 4. Ons 后 都 达到 了 
动态 平衡 。 然 后 进行 蛋白 酶 各 氨基 酸 骨 架 Ca 原子 在 整个 10ns 分 子 动力 学 模 
拟 中 相对 于 初始 输入 结构 的 综合 振动 计算 ， 以 了 解 TL-3 抑制 剂 分 子 的 结合 
对 HIV-I 蛋 白 酶 稳定 性 的 影响 ， 结 果 见 图 5. 20。 从 图 5. 20 可 以 看 出 ， 四 
个 体系 的 蛋白 酶 A HE (氨基 酸 残 基 1 一 99) 的 振动 情况 (RMSF) 均 不 同 于 
B 链 ， 暗 示 着 对 称 性 抑制 剂 分 子 TL-3 与 蛋白 酶 采用 的 是 不 对 称 结合 方式 。 


But 
—— Bmut 
— Pwt 


—— Fmut 


0.0 - 
0 2000 4000 6000 8000 10000 


时 间 /ps 
图 5.19 各 体系 蛋白 酶 骨架 原子 的 RMSD 随时 间 变化 规律 〈 见 彩 图 


хаяж» (Ен. 非 键 相互 作用 对 于 维持 蛋白 结构 、 识 别 过 程 、 蛋 
白质 - 配 体 相互 作用 都 是 非常 重要 的 。 其 中 的 氢 键 和 疏水 相互 作用 在 抑制 剂 
与 蛋白 质 之 间 的 亲和力 大 小 发 挥 着 至 关 重 要 的 作用 。 因 此 ， 此 研究 进行 了 定 
量 分 析 和 评价 这 些 氢 键 ， 计 算 了 10ns 分 子 动力 学 模拟 中 所 有 氢 键 的 存活 时 
间 (或 者 称 为 “寿命 ”和 “Lifetime”)， 如 表 5. 3 Втлх. Ети 蛋白 酶 与 TL- 
3 抑制 剂 之 间 没 有 一 个 氢 键 的 寿命 大 于 12% ， 也 就 是 说 它们 之 间 几 乎 没有 氢 
键 稳定 形成 。 对 于 Bwt 和 Bow 蛋白 酶 ， 氢 键 主要 形成 于 挡 板 区 (Пар) 
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图 5.20 各 体系 中 骨架 碳 原子 在 分 子 动力 学 模拟 中 的 振动 情况 〈 见 彩 图 ) 


[如 表格 中 的 Пе50 (B), Gly48, Gly48 (B), Gly49 (B)] 和 催化 三 角 区 
(如 表格 中 的 Asp25、Asp29) 。 而 对 于 Fwt 蛋白 酶 ， 氢 键 主要 形成 于 催化 三 
角 区 [如 表格 中 的 Asp25，Gly27 (B), Asp29 (B), Asp30 (B)]。 分 子 动 
力学 模拟 所 得 到 的 这 个 结果 与 实验 结果 总 体 趋势 是 一 致 的 ， 即 耐 药 性 随 着 蛋 
白 酶 与 抑制 剂 分 子 之 间 氢 键 相 互 作 用 的 减少 而 上 升 ， 如 表 5.4 所 示 。 


表 5.3 各 个 蛋白 酶 与 抑制 剂 分 子 之 间 的 氢 键 存活 时 间 


项 目 киж җи But Bmut Fut Fmut 

Te50(B)N | TL-3 052 77.57% 60.45% = = 
Gly48N TL-3 08 59.72% 21.29% 18. 68% = 
Glys9(B)N | TL-3 052 一 50.51% 一 - 
挡 板 区 TL-3 N54 | Gly48(B)O | 43.08% 一 一 一 
(flap) TL-3 N52 | Gly48(B)O 13.51% 67.13% 一 一 
Gly48CB)N | TL-3 N54 34. 10% - 一 一 

Пеѕом TL-3 052 一 36.02% - 1.69% 
TL-301 | Азр25001 | 49.07% = = = 
TL-3O1 | Asp250D2 | 36.17% 一 74.16% а 
TL-3 O51 | Азр25001 26. 00% = = = 
TL-3051 | Asp250D2 16.95% 一 一 一 
TL-3O1 | Asp25(B)OD1| 24.52% = = = 
催化 区 TL-301 | Asp25(B)OD2| 12.67% = 14.13% = 
Ceatalyti) | TL3 N52 | Gly27(B)O 一 一 77.87% 一 
Asp29N тз O4 42. 26% 一 = 
Asp29(B)N TL-3 059 a a 73.51% = 
Asp30(B)N | TL-3 059 — 一 57. 00% = 
TL-3 N54 | Asp29(B)OD2 一 一 28. 58% = 

共计 3.93 2.77 3.44 0.12 


Ж. 只 有 那些 存活 时 间 超 过 1076 0] SC RE LIEF ZEE Te EP ЈН, ARK I 48 位 至 58 位 氨基 酸 ， 
催化 区 包括 23 位 至 32 位 氨基 酸 。 
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R54 蛋白 酶 与 抑制 剂 分 子 氢 键 相互 作用 与 耐 药 性 之 间 的 关系 


项 目 But Bmut Fut Fmut 
氢 键 的 平均 数目 3.93 2.77 3.44 0.12 
К, ffi 1 3 7 54 


注 ， 耐 药性 以 实验 测 得 的 抑制 常数 Ki 为 Вил 蛋白 酶 的 多 少 倍 来 表示 。 


另 一 方面 ， 针 对 上 市 的 口服 药物 的 市 场 调研 结果 显示 ， 平 均 每 个 药物 包 
含 1 一 2 个 氢 键 供 体 和 3 一 4 个 氢 键 受 体 ， 而 一 个 药物 中 朴 水 原子 的 平均 数目 
有 16 个 之 多 。 这 些 数据 提示 我 们 在 药物 诱导 结合 到 受 体 上 的 过 程 中 ， 朴 水 
相互 作用 是 占 主导 地 位 的 驱动 力 。 有 关 10ns 分 子 动力 学 模拟 中 朴 水 作用 的 
数据 统计 见 表 5. 5。 从 表格 中 可 看 出 ，Bmut 蛋白 酶 与 TL-3 抑制 剂 分 子 之 间 
的 疏水 作用 与 Bwt 体系 大 致 相同 。 与 Bwt 体系 相 比 ，Fwt 蛋白 酶 与 抑制 剂 
之 间 在 S1/S1 ' 朴 水 口袋 少 了 3 个 朴 水 作用 ; Ети: 蛋白 酶 与 抑制 剂 之 间 在 催 
化 三 角 区 则 少 了 6 个 疏水 作用 。 这 些 减 少 消失 的 朴 水 相互 作用 很 可 能 就 是 引 
起 Кил, Етш 蛋白 酶 耐 药 性 的 主要 原因 。 


RSS 分子 动力 学 模拟 中 各 蛋白 酶 疏水 相互 作用 统计 


项 目 But Bmut Fut Fmut 
催化 区 7 6 9 1 
挡 板 区 4 4 4 4 
si/si'n& 6 6 3 9 
其 他 区 域 0 1 2 1 
共计 17 17 18 15 


ik. 表 中 所 表示 出 的 是 各 个 蛋白 酶 与 抑制 剂 分 子 之 间 存 活 时 间 大 于 50% OE TK HL Eh 


5.7.4 结构 变化 分 析 


5.7.4.1 Bmut f Вил 蛋白 酶 之 间 的 结构 差异 

Bmut 体系 与 Bwt 体系 相 比 ， 主 要 差异 在 于 氢 键 而 不 是 疏水 相互 作用 。 
表 5. 3 显示 ， 在 Bmut 蛋白 酶 与 抑制 剂 的 复合 物 中 ， 抑 制剂 TL-3 中 心 二 醇 
的 羟基 与 蛋白 酶 催化 活性 中 心 的 Asp25/Asp25 (B) 的 氧 原子 ODI/OD2 之 
间 关 键 性 的 氢 键 消失 了 ， 取 而 代 之 的 却 是 Asp29 的 N 原子 与 抑制 剂 分 子 的 
PRAGA F O4 之 间 的 毛 键 。 之 所 以 说 抑制 剂 中 心 二 醇 的 羟基 与 蛋白 酶 催化 中 
心 的 Asp25/Asp25 (В) 之 间 形 成 的 氢 键 非常 关键 ， 主 要 是 因为 在 两 个 催化 
天 冬 氨 酸 [Asp25/Asp25 (B)] 之 间 只 能 容纳 、 结 合 〈 通 过 氢 键 的 方式 ) 
抑制 剂 二 醇 中 心 的 一 个 羟基 ， 学 者 们 认为 这 种 不 对 称 结合 仿效 了 天 冬 氨 酰 蛋 
白 酶 催化 水 解 反应 中 的 那个 四 面体 型 过 渡 态 ， 有 效 地 占据 了 和 蛋白酶 天 然 底 物 
的 结合 位 点 ， 从 而 实现 了 竞争 性 抑制 的 抑制 剂 疗效 。 因 此 ， 这 么 关键 的 氢 键 
的 消失 很 可 能 就 是 降低 抑制 剂 分 子 TL-3 与 Bmut 蛋白 酶 之 间 结 合 亲和力 的 
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根本 因素 ， 从 而 最 终 导致 Bmut 蛋白 酶 耐 药 性 的 产生 。 


asa WB Wwe "13881508 
= ош шыш 


RMS 振 动人 


50 100 150 200 


图 5.22 Bmut 蛋白 酶 (红色 ) 与 Bw (WE) 蛋白 酶 的 空间 结构 亚 合 〈 见 彩 图 ) 


图 5. 21 显示 ，Bmut 蛋白 酶 的 氨基 酸 位 点 Ala28、Gln61、lle72、Trp6 
(B), Leu38 (B), Пе50 (B) 相对 于 Bwt 蛋白 酶 振动 幅度 要 大 。 对 氢 键 作 
用 影响 最 大 的 就 是 催化 三 角 区 的 Ala28 的 大 幅度 偏 移 ， 使 得 抑制 剂 二 醇 中 心 
的 羟基 与 Asp25/Asp25 (B) 之 间 的 重要 氧 键 消 失 了 。 从 But 与 Bmut 蛋白 
酶 的 平均 构象 〈 与 计算 出 的 平均 结构 最 接近 的 时 刻 点 构象 ) WRAL 
( 见 图 5.22). 中 可 以 发 现 ， 活 性 位 点 氨基 酸 中 偏 移 最 大 的 就 是 Asp25 的 骨架 
Ca 原子 一 一 Bmut 的 Asp25 向 远离 结合 腔 的 方向 偏 移 了 3. 32A。 为 什么 会 
有 这 样 的 位 置 偏 移 呢 ?原来 ，Bmut 蛋白 酶 发 生 了 L90M 突变 ，90 位 的 氨基 
M Met 的 侧 链 比 Bwt 蛋白 酶 的 Leu 变 得 体积 更 大 ， 使 得 Met90 与 Bmut Ж 
白 酶 的 催化 环 OX3E 24 一 26) 形成 了 更 多 的 范 德 华 相互 作用 。 因 此 ， 推 测 
Bmut 蛋白 酶 氨基 酸 之 间 增 加 的 范 德 华 相互 作用 限制 了 氨基 酸 残 基 24 一 29 
的 骨架 的 自由 运动 能 力 ， 大 大 降低 了 氨基 酸 残 基 24 一 29 的 骨架 的 灵活 性 ， 
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因而 当 抑 制剂 分 子 TL-3 结合 到 Bmut 蛋白 酶 上 时 ， 这 些 活性 位 点 的 肽 链 很 
“僵硬 ”， 不 能 做 出 相应 的 结构 调整 去 更 好 地 与 TL-3 接触 、 结 合 。 


5.7.4.2 Fut 和 Вит 蛋白 酶 之 间 的 结构 差异 

Fut 体系 与 Bwt KAM, Fut 蛋白 酶 与 TL-3 之 间 的 氢 键 主要 形成 于 
催化 三 角 区 的 Asp25、Gly27 (В), Asp29 (B), Asp30 (B), 而 Bwt 蛋白 
酶 除了 在 催化 三 角 区 ， 还 在 挡 板 区 形成 氢 键 的 Пе50 (B), Gly48, Gly48 
(В). Fwt 蛋白 酶 在 挡 板 区 缺失 的 氢 键 与 其 B 链 挡 板 区 较 大 幅度 的 振动 相 一 
Sk ( 见 图 5. 23), Fw 蛋白 酶 的 挡 板 区 与 抑制 剂 分 子 没有 形成 氢 键 ， 这 在 一 
定 程 度 上 加 剧 了 其 耐 药 性 的 产生 。 从 Еш 与 Bw 蛋白 酶 的 平均 构象 的 释 合 
比 对 图 局 部 图 (图 5. 24) 中 可 以 看 出 ， 相 对 于 Bur 蛋白 酶 ， 包 含 M36I Ж 
变 的 Fwt 蛋白 酶 的 环 区 主 链 RE 33 一 42) HAARD I ТАНИ. fF 
细 分 析 突 变 位 点 第 36 位 氨基 酸 后 发 现 ， 突 变 成 较 短 的 Пе 后 ， 为 了 维持 第 
36 位 氨基 酸 位 点 与 周围 氨基 酸 之 间 的 相互 作用 不 变 ， 较 短 的 异 亮 氨 酸 的 侧 
链 将 环 区 GRE 33 一 42) 的 主 链 向 结合 腔 的 方向 下 拉 ， 所 以 匀 链 区 的 下 拉 
运动 带动 了 挡 板 区 的 大 幅度 振动 。 
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图 5. 23 分 子 动力 学 模拟 中 Fwt 和 Bw 蛋白 酶 RMSF 差异 


Lesh, Fut 体系 与 Bwt 体系 更 大 的 区 别 在 于 朴 水 作用 上 的 差异 。 从 朴 
水 作用 的 总 数 上 看 ， 两 个 体系 基本 相同 ， 但 是 从 具体 的 分 布 上 看 ， 差 异 巨 
Xa 相对 于 Bwt KR, For 蛋白 酶 催化 三 角 区 形成 的 朴 水 作用 增加 了 2 个 ， 
S1/SV ' 朴 水 口袋 形成 的 疏水 作用 减少 了 3 个 。 在 Fwt 体系 中 抑制 剂 TL-3 的 
Pl ЖИ] 〈 结 构 见 图 5.25) 与 蛋白 酶 的 S1/S1' 疏 水 口袋 [Ile50，Pro81 (В), 
Val82 (B), Ile84 (B)] 之 间 已 经 不 再 形成 疏水 相互 作用 。 通 过 又 合 比 对 
Fut 与 Вил 体系 的 平均 构象 〈 见 图 5.24) RH. Ви 体系 中 抑制 剂 TL-3 
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图 5.24 Fue (绿色 ) 和 Bue (黄色 ) ЖАВ ВЕЕ (а) 和 S1/SI'Hixk 
OR b) 的 空间 结构 得 合 〈 见 彩 图 ) 


PL 


图 5.25 C2 对 称 的 二 醇 抑 制剂 分 子 TL-3 的 化 学 结构 


的 Pl 苯 环 被 紧凑 地 塞 在 由 Bwt 蛋白 酶 B 链 的 “80s” 环 区 的 Pro81 (В), 
Val82 (B) 等 氨基 酸 侧 链 所 形成 的 SI/S1' 朴 水 口袋 中 。 而 在 Fwt 体系 中 ， 
由 于 Fw 蛋白 酶 B 链 的 “80s” 环 区 有 了 很 大 的 偏 移 ，Pro8l (B) 的 Ca 原 
子 、Val82 (B) 的 Ca JAF H Bwt 蛋白 酶 的 相应 位 点 向 远离 结合 腔 的 方向 分 
别 偏 移 了 6.05A、4. 91A， 无 法 再 形成 疏水 作用 ， 从 而 降低 了 抑制 剂 TL-3 
与 Fwt 蛋白 酶 的 结合 亲和力 ， 最 终 导 致 耐 药 性 的 产生 。 
5.7.4.3 Ети 蛋白 酶 和 But 蛋白 酶 之 间 的 结构 差异 

Fmut 蛋白 酶 与 TL-3 抑制 剂 分 子 之 间 没 有 形成 氢 键 〈 见 表 5. 3)， 形 成 
的 疏水 作用 也 较 少 ， 尤 其 是 催化 三 角 区 只 形成 了 1 个 朴 水 相互 作用 CIL 
5.5)， 所 以 Fmut 蛋白 酶 呈现 出 最 显著 的 耐 药 性 ， 这 与 实验 中 测 得 的 抑制 常 
数 这 个 体系 最 大 是 相 一 致 的 。 从 Ети 蛋白 酶 结构 的 角度 分 析 ， 突 变 M361 
改变 了 和 蛋白酶 挡 板 区 的 构象 ， 并 且 突 变 V82A 使 得 抑制 剂 分 子 TL-3 结构 重 
排 。 因 挡 板 区 与 Pro81 的 折 扰 密封 了 原 有 的 裂缝 ， 抑 制剂 的 Pl’ MA ARH 
只 能 离开 原来 的 位 置 ， 朝 着 第 82 位 丙 氨 酸 周围 的 空 腔 转动 〈 见 图 5. 26). du 
制剂 分 子 这 样 的 结构 重 排 造 成 P1' 基 团 与 整个 S1' 朴 水 口袋 之 间 的 相互 作用 
数目 〈 除 了 朴 水 作用 ， 还 有 其 他 非 键 相互 作用 ， 如 范 德 华 相互 作用 等 ) 大 大 
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大 大 减少 ， 再 加 上 新 生成 的 这 个 空 腔 使 得 原来 的 SI К AREER, JA 
而 导致 抑制 剂 分 子 与 蛋白 酶 结合 得 很 松散 ， 其 结合 亲和力 大 大 下 降 ， 最 终 导 
ЖС Fmut 蛋白 酶 的 耐 药 性 的 产生 。 


图 5.26 Етш ( 蓝 色 ) 和 But (黄色 ) 蛋白 酶 空间 结构 得 合 〈 见 彩 图 ) 


5.7.5 结论 


HIV- 1 病毒 的 耐 药 性 是 由 病毒 在 其 复制 周期 中 发 生 的 突变 所 造成 的 ， 究 
其 根本 ， 则 是 因为 病毒 的 复制 极其 迅速 ， 同 时 其 逆转 录 酶 没有 校正 功能 。 本 
实例 以 四 种 不 同 的 HIV-T AE (Bwt, Bmut, Еш 和 Етш) 与 同一 种 蛋白 酶 
抑制 剂 分 子 TL-3 的 复合 物 晶 体 为 研究 对 象 ， 运 用 分 子 动力 学 模拟 的 技术 手段 ， 
探索 组 成 HIV-I 蛋 白 酶 亚 基 的 99 个 氨基 酸 位 点 中 哪些 位 点 的 突变 与 HIV-] 病 毒 
耐 药性 的 产生 相关 ， 又 是 通过 怎样 的 结构 变化 导致 了 抑制 剂 分 子 与 HIV-I 蛋 白 
酶 之 间 的 结合 亲和力 下 降 ， 从 而 最 终 引 发 耐 药 性 的 形成 。 

了 解 了 耐 药性 的 形成 原因 ， 我 们 就 可 以 针对 这 一 结构 变化 ， 设 计 更 有 效 
的 抑制 剂 来 治疗 新 型 的 HIV 病毒 导致 的 艾滋 病 ， 为 新 药 的 研发 提供 理论 指 
导 ， 减 少 药物 开发 的 前 期 投入 ， 降 低 生 产 成 本 。 


5.8 本 章 总 结 


前 面 介绍 的 几 个 例子 仅仅 是 比较 有 代表 性 的 实例 ， 分 子 模拟 在 蛋白 研究 
中 的 应 用 是 非常 广泛 的 ， 方 法 也 是 多 种 多 样 的 ， 在 这 里 就 不 一 一 介绍 了 。 相 
信 通 过 以 上 的 例子 大 家 对 于 分 子 模拟 在 蛋白 质 研究 中 的 应 用 也 初步 有 些 直观 
的 认识 ， 希 望 大 家 在 以 后 的 学 习 和 工作 过 程 中 多 多 实践 ， 并 推动 分 子 模拟 应 


ATS 


白质 研究 的 发 展 。 虽 然 分 子 模拟 技术 日 渐 成 熟 ， 但 是 目前 
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蛋白 质 研究 中 所 起 的 作用 不 是 决定 性 的 ， 它 更 多 的 是 提供 给 人 们 结构 方面 的 
信息 ， 所 以 必须 与 实验 相互 结合 ， 才 能 更 好 地 达到 研究 目的 。 
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第 6 章 


锌 梅 核酸 酯 的 构建 


РНЕ Н (zinc finger protein) 是 包含 一 系列 锌 指 结构 的 DNA 特异 性 结 
合 蛋 白质 ， 是 转录 因子 的 一 种 ， 与 基因 表达 、 基 因 调 控 、 细 胞 分 化 和 胚胎 发 
育 等 密切 相关 。 锌 指 核酸 酶 (zinc finger nuclease) 是 由 锌 指 蛋白 和 非特 异性 
核酸 内 切 酶 构成 ， 发 挥 特异 性 核酸 内 切 酶 的 作用 ， 其 中 锌 指 蛋白 起 到 识别 并 
结合 特异 碱 基 序列 的 作用 。 锌 指 核酸 酶 的 出 现 ， 不 仅 大 大 提高 了 基因 组 靶 向 
修饰 的 特异 性 ， 而 且 效率 也 提高 了 ， 已 报道 的 转化 率 达 到 29% ， 甚 至 更 高 。 
锌 指 核酸 酶 技术 给 重组 人 类 基因 组 带 来 了 希望 ， 使 基础 研究 具有 基因 治疗 的 
意义 。 本 章 介绍 了 锌 指 蛋 白 的 结构 和 功能 ， 并 以 镰刀 形 红细胞 贫血 症 为 例 进 
行 实验 设计 ， 构 建 锌 指 核酸 酶 用 于 基因 治疗 。 

马萨诸塞 综合 医院 病理 学 家 、 哈 佛 大 学 副教授 J Keith Joung 是 锌 指 协会 
(http: //www. zincfingers. org) 的 主要 领导 者 ， 他 带领 八 个 实验 室 组 成 的 协会 
提出 了 制造 “ 锌 指 核酸 酶 ”的 一 种 开源 方式 。 明 尼 苏 达 大 学 基因 工程 中 心 主 
f Daniel Voytas 也 是 锌 指 协会 的 创办 者 之 一 ， 他 的 实验 室 利 用 这 种 方法 创造 
的 锌 指 核酸 酶 对 烟草 细胞 进行 修改 ， 从 而 使 其 具备 了 抗 除草 剂 的 特性 。 


6.1 fHüxn 


锌 指 蛋白 是 一 种 蛋白 质 结构 基 元 ， 常 出 现在 DNA 结合 蛋白 中 ， 一 个 含 
有 大 约 30 个 氨基 酸 的 环 和 Zn? * 形 成 手指 状 的 结构 ，Zn2? * 与 环 上 的 4 个 半 胱 
AM (Cys) 或 2 个 半 胱 氨 酸 和 2 个 组 氨 酸 (His) 形成 配 位 。 锌 指 蛋白 通 
常 由 一 系列 锌 指 组 成 ， 每 一 个 锌 指 单位 指 部 可 以 伸 和 人 DNA 双 螺 旋 的 深 沟 ， 
接触 5 个 核 苷 酸 。 锌 指 蛋 白 最 初 在 非洲 爪 蜡 中 发 现 ， 在 动物 、 植 物 以 及 微 生 
物 中 都 有 广泛 的 分 布 。 
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6.1.1 锌 指 蛋白 的 分 类 


蛋白 质 的 结构 与 功能 密切 相关 ， 根 据 锌 指 蛋白 保守 结构 中 半 胱 氨 酸 
(O MAAR CHO 的 数目 和 位 置 的 不 同 ， 可 将 锌 指 蛋白 分 为 CH. 型 、 
C;HC HJ, (Сг): XI, Ca 型 和 Ce 型 等 ，Cs Ho 型 锌 指 蛋白 最 为 普遍 。 


6.1.1.1 CoH: 型 锌 指 蛋 白 
CH: 型 锌 指 蛋白 也 是 经 典型 锌 指 蛋白 ， 最 先 在 爪 蟾 TILA 中 发 现 ， 是 
目前 研究 最 多 的 一 类 锌 指 蛋白 。 这 类 锌 指 
蛋白 能 形成 简单 的 BBa 模型 结构 ， 其 中 a 链 
的 氨基 酸 残 基 能 识别 目标 碱 基 序列 ， 如 图 
6.1. Cz Hz 型 锌 指 蛋 白 以 单 体 的 形式 与 核 
酸 发 生 相 互 作用 。 例 如 人 类 的 hZF1 蛋白 和 
人 类 转录 因子 SP1 都 是 这 类 蛋白 。 
С.Н. 型 锌 指 蛋白 具有 靶 位 点 特异 性 ，p 
且 其 结构 简单 ， 因 此 C; Ho 型 锌 指 蛋白 被 
用 作 人 造 锌 指 蛋 白 的 骨架 。 保 持 С.Н, 型 Zo 
锌 指 蛋白 的 基本 结构 不 变 ， 替 换 识别 核酸 图 6. 1 C,H, 型 锋 指 蛋白 结构 示意 图 
序列 的 特定 氨基 酸 残 基 ， 再 融合 其 他 功能 
域 ， 就 可 以 得 到 具有 枝 向 性 的 人 造 锌 指 蛋 白 。 人 造 锌 指 蛋 白 可 以 抑制 或 激活 
WIE, XP DNA 进行 修饰 ， 对 靶 基 因 闹 除 、 替 换 等 。 因 此 ， 人 造 锌 指 蛋白 
应 用 前 景 广阔 ， 研 究 价值 显著 ， 是 未 来 人 类 基因 治疗 的 革命 性 的 工具 。 


6.1.1.2 C, 型 锌 指 蛋白 

C, 型 锌 指 蛋 白 结构 中 含 8 个 保守 的 Cys 残 基 ， 每 4 个 Cys 残 基 与 一 个 
Zn2+ 配 位 结合 ， 形 成 DNA 识别 位 点 。 例 如 GATA 蛋白 、LIM 蛋白 及 糖 皮 
质 激素 等 都 含有 Cs 型 锌 指 蛋白 。C4 型 锌 指 蛋白 以 二 聚 体 方式 与 核酸 结合 发 
挥 作 用 ， 两 个 亚 基 的 a- 识 别 螺旋 分 别 与 DNA 大 沟 相 结合 ， 两 个 DNA 结合 
位 点 间隔 约 为 3 一 4bp， 通 常 同 源 二 聚 体 识 别 靶 基因 的 反 向 重复 序列 ， 而 异 
源 二 聚 体 结合 正 向 重复 序列 。 
6.1.1.3 C. 型 锌 指 蛋白 

Ce 型 锌 指 蛋白 由 6 个 保守 的 Cys 残 基 与 2 个 Zn2+ 以 配 位 键 结 合 ， 形 成 
DNA 结合 域 ， 以 同 二 聚 体形 式 与 DNA 相 结合 作用 。Cs 型 锌 指 蛋白 家 族 在 
酵母 等 真菌 中 大 量 存在 ， 如 酵母 转录 因子 Gal4p、Leu3p 等 。 这 类 锌 指 只 有 
一 个 锌 指 区 域 , 但 是 却 可 以 结合 2 个 锌 离子 。 


6.1.2 锌 指 蛋 白 的 作用 及 机 制 
锌 指 蛋 白 依靠 其 特殊 的 蛋白 质 锌 指 结构 ， 可 以 和 DNA, RNA 及 DNA- 
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RNA 杂交 双 链 分 子 特异 性 结合 ， 也 可 以 与 其 他 蛋白 质 发 生 相互 作用 。 锌 指 
蛋白 的 这 些 性 质 ， 使 其 参与 细胞 分 化 、 增 殖 和 凋 亡 等 多 种 重要 生命 过 程 ， 对 
DNA 识别 、RNA 包装 、 转 录 及 转录 后 调控 、 蛋 白质 折 琶 和 装配 、 肿 瘤 的 形 
成 和 机 体 免疫 等 有 重要 作用 。 


6.1.2.1 锌 指 蛋 白 对 核酸 的 识别 

锌 指 蛋 白 包含 特异 性 的 锌 指 结构 ， 这 种 特异 性 的 锌 指 结构 在 对 DNA 的 
特异 性 识别 和 结合 中 起 重要 作用 。 锌 指 蛋白 能 特异 性 地 识别 DNA, FBR 
通过 锌 指 的 螺旋 上 的 氨基 酸 与 DNA 双 螺 旋 大 槽 的 特异 性 接触 。 小 鼠 转录 
因子 Zif268 蛋白 与 DNA 结合 形成 复合 物 的 晶体 结构 揭示 了 锌 指 蛋 白 与 
DNA 之 间 的 相互 作用 : 每 个 锌 指 的 а 螺旋 与 DNA 上 的 3 个 碱 基 结 合 ; 所 
有 的 碱 基 特异 性 接触 都 位 于 DNA 双 螺 旋 的 一 条 链 上 ; 每 个 锌 指 相对 于 
DNA 的 取向 是 相同 的 ， 与 DNA REFIT, N 端 靠近 DNA 的 3 端 ，C 端 靠 
近 DNA 的 5' 端 。 

锌 指 蛋 白 不 仅 能 与 DNA 发 生 相 互 作 用 ， 也 可 以 识别 RNA， 例 如 非洲 
wee ТЕША, ТЕША 不 仅 可 以 和 DNA 结合 ， 也 可 以 和 КМА 结合 ， 但 其 
结合 作用 位 点 不 同 。N 端的 锌 指 1 一 3 MPAA ОМА, PH 4 一 6 识别 结合 
5S rRNA。 除 了 一 级 结构 外 ， 磷 酸 骨 架 在 对 КМА 的 识别 过 程 中 起 到 了 重要 
的 作用 。 

锌 指 蛋白 与 DNA-RNA 杂交 双 链 分 子 也 是 特异 性 结合 的 。 实 验证 明 ， 用 
人 为 设计 的 锌 指 蛋 白 分 别 与 DNA、DNA-RNA 杂交 双 链 分 子 结合 ， 发 现 其 和 
DNA-RNA 杂交 双 链 分 子 的 结合 强度 是 它 与 双 链 DNA 分 子 结合 强度 的 5 倍 。 


6.1.2.2 转录 因子 

许多 锌 指 蛋 白 的 结构 域 包含 能 与 核酸 特异 结合 的 区 域 ， 并 与 某 些 效应 结 
构 域 (如 KRAB、SCAN、BTBPPOZ、SNAG、SANT 和 PLAG 等 ) ЖЖ, 
这 类 锌 指 蛋 白 常 作为 转录 因子 起 作用 ， 可 调控 靶 基 因 的 转录 。 

包含 KRAB 结构 域 的 锌 指 蛋 白 是 哺乳 动物 中 最 大 的 转录 调控 因子 家 族 。 
这 种 锌 指 蛋 白 约 占 人 类 基因 组 中 已 知 锌 指 蛋白 的 1/3， 由 57 一 75 个 保守 的 
氨基 酸 残 基 组 成 ， 可 分 成 A 盒 和 了 B 盒 两 个 结构 域 。 其 中 A 盒 在 转录 抑制 中 
起 核心 作用 ，B 盒 起 辅助 作用 。SCAN 结构 域 是 一 个 高 度 保守 的 富 含 亮 氨 酸 
的 结构 域 ， 仅 在 脊椎 动物 中 存在 ， 起 转录 抑制 作用 。 实 验 表 明 ，SCAN 结构 
域 可 以 调节 蛋白 质 之 间 的 相互 作用 ， 并 与 其 他 蛋白 质 协同 调节 转录 。BTB 
结构 域 也 称 为 POZ 结构 域 ， 是 一 个 高 度 保守 的 结构 域 。BTB 结构 域 由 四 个 
a 螺旋 组 成 ， 其 主要 功能 是 介 导 蛋白 质 相互 作用 形成 蛋白 质 复合 体 。BTB 蛋 
白 不 仅 有 转录 抑制 作用 ， 还 有 转录 激活 作用 ， 例 如 PLZF。Cs、Cs 型 转录 
因子 也 比较 常见 。Cs 型 转录 因子 ， 主 要 是 由 类 固 醇 受 体 家 族 成 员 组 成 的 。 
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C, 型 锌 指 蛋白 在 酵母 等 真菌 中 较为 多 见 。 


6.1.2.3 转录 后 调控 

一 些 锌 指 蛋 白 能 与 КМА 结合 ， 这 类 和 锌 指 蛋白 的 功能 是 参与 mRNA 的 
成 熟 剪 接 以 及 降解 等 转录 后 调控 过 程 。 例 如 锌 指 蛋白 S27 可 以 结合 损伤 的 
mRNA 分 子 ， 参 与 后 者 的 加 工 处 理 。 锌 指 蛋白 与 RNA 相互 作用 的 现象 越 来 
越 受到 关注 ， 但 是 二 者 的 作用 模式 尚未 研究 透彻 。 


6.1.2.4 介 导 蛋白 质 之 间 相 互 作用 

一 些 锌 指 蛋 白 特异 地 介 导 蛋白 质 之 间 相互 作用 ， 这 类 锌 指 蛋 白 主 要 包括 
LIM 锌 指 、MYND 锌 指 、PHD 锌 指 和 RING 锌 指 等 。 例 如 LIM 结构 域 
它 是 一 种 介 导 和 蛋白质- 蛋白 质 相互 作用 的 锌 指 基 元 ， 是 很 多 LIM 蛋白 行使 其 
生物 学 功能 的 关键 结构 域 。LIM 结构 域 由 两 个 串联 的 锌 指 结构 组 成 ， 富 含 
半 胱 氨 酸 和 组 氨 酸 。LIM 结构 域 不 与 DNA 结合 ， 而 是 介 导 蛋白 质 间 的 相互 
作用 ， 例 如 可 以 与 转录 因子 结合 ， 也 可 以 和 不 能 与 DNA 结合 的 辅助 因子 结 
合 。 对 于 蛋白 质 和 蛋白 质 之 间 相 互 作用 的 研究 ， 有 助 于 揭示 这 些 蛋 白质 的 生 
物 学 机 制 。 


6.1.3 锌 指 蛋 白 与 免疫 性 疾病 


锌 指 蛋白 在 生物 体 的 免疫 系统 中 起 到 了 非常 重要 的 作用 ， 它 能 在 免疫 系 
统 的 各 个 环节 中 起 调控 作用 ， 如 调控 T 细胞 、B 细胞 的 活化 及 细胞 因子 的 
产生 ， 并 和 临床 许多 疾病 相关 。 随 着 研究 的 深入 及 人 造 锌 指 蛋白 的 合成 ， 为 
免疫 系统 的 调节 及 免疫 性 疾病 的 治愈 提供 了 新 的 解决 途径 。 


6.1.3.1 锌 指 蛋白 与 自身 免疫 病 APECED 

自身 免疫 病 APECED (autoimmune polyendocrinopathycandidiasis-ec- 
todermal dystrophy) 又 称 自身 免疫 性 多 腺 体 综 合 征 Т (autoimmune 
polyglandular syndrome type І, APS I )， 是 一 种 罕见 的 常 染色 体 隐 性 遗 
传 病 ， 主 要 表现 为 内 分 泌 器 官 特异 性 自身 免疫 病 ， 通 常 还 伴 有 白色 念珠 菌 感 
染 ， 是 唯一 一 个 单 基因 缺乏 导致 的 免疫 性 疾病 。 自 身 免疫 调节 因子 (auto- 
immune regulator，AIRE) 是 一 种 具有 转录 活化 潜能 的 DNA 结合 蛋白 ， 它 
的 突变 可 以 引起 自身 免疫 病 APECED。AIRE 基因 包括 两 个 PHD 型 锌 指 域 
和 一 个 DNA 结合 区 域 SAND，pHD 型 锌 指 有 与 大 分 子 〈 核 酸 或 蛋白 质 ) 结 
合 的 特性 。 


6.1.3.2 锌 指 蛋白 与 移植 免疫 
肝脏 移植 后 产生 的 急性 排斥 炎症 反应 和 锌 指 蛋 白 A20 AK. BEA 
A20 是 一 种 最 早 发 现 于 人 脐 静 脉 内 皮 细 胞 的 TNF-a 诱导 性 基因 产物 ， 其 表 
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达 需 要 NFB 激活 ， 但 对 МЕ-кВ 激活 起 负 反馈 抑制 作用 ， 抑 制 血管 内 皮 细 
胞 激活 。A20 抑制 CD40-CD40L 结合 诱发 的 内 皮 细 胞 激活 ， 而 CD40-CD40L 
结合 是 诱发 移植 排斥 的 机 理 之 一 。A20 还 能 通过 抑制 NF2«B 激活 而 产生 抗 
炎 功 效 ， 保护 肝 细胞 并 促进 肝 再 生 。 


6.1.3.3 锌 指 蛋 白 与 肿瘤 免疫 

ZNF165 基因 是 锌 指 蛋 白 家 族 中 的 一 员 ， 在 肝癌 、 胃 癌 、 结 肠 癌 和 肺癌 
中 都 能 检测 到 ZNF165 mRNA 的 表达 ，ZNF165 mRNA 以 高 水 平 在 肝癌 组 
织 与 睾丸 组 织 中 表达 ， 而 在 配对 的 癌 旁 组 织 与 其 他 正常 组 织 中 仅 存在 很 低 水 
平 的 表达 。 在 肿瘤 免疫 中 ，ZNF165 是 一 种 可 以 诱导 出 免疫 应 答 的 抗原 。 锌 
HEA A20 参与 机 体 炎 症 反应 和 细胞 凋 亡 的 重要 调控 。 研 究 表 明 ，A20 在 
包括 乳腺 癌 耐 药 株 、 炎 性 乳腺 癌 、 肾 透明 细胞 癌 和 结 直肠 癌 细 胞 系 、 前 列 腺 
癌 羟 基 喜 树 碱 耐 药 标 、 鼠 纤维 肉瘤 细胞 SV80 等 多 种 人 类 肿瘤 细胞 系 和 临床 
标本 中 过 表达 。 


6.1.3.4 锌 指 蛋白 与 白血病 

早 幼 粒 细胞 白血病 锌 指 基因 (promyelocytic leukemia zinc finger, PLZF) 
与 白血病 发 病 密切 相关 。PLZF 蛋白 的 C 端 含有 9 个 Co Ho 型 锌 指 结构 ， 可 以 
和 DNA 结合。 转录 因子 Spl 是 存在 于 哺乳 动物 细胞 中 的 一 种 基因 调控 锌 指 蛋 
Al. Spl 能 调控 早 幼 粒 细胞 白血病 基因 (promyelocytic leukemia, PML) 的 转 
录 ， 降 解 PML-RARo 蛋白 , 诱导 APL 细胞 分 化 ; 能 调控 白血病 相关 和 蛋白 
EEN (extra eleven nineteen) 的 表达 ， 限 制 EFN 的 过 量 表达 而 达到 治疗 白 血 
病 的 效果 ; 对 K562 白血病 细胞 增殖 、 凋 亡 及 耐 药 性 产生 影响 。 


6.2 饼 指 核酸 栈 


6.2.1 核酸 酶 


在 高 等 动 植物 中 核酸 的 分 解 需要 核酸 酶 的 参与 ， 核 酸 酶 作用 于 核 苷 酸 之 
间 的 磷酸 二 酯 键 。 不 同 来 源 的 核酸 酶 ， 相 同 来 源 不 同 种 类 的 核酸 酶 ， 其 专 一 
性 和 作用 方式 都 有 不 同 。 

根据 作用 底 物 的 不 同 ， 可 以 分 为 核糖 核酸 酶 、 脱 氧 核糖 核酸 酶 。 只 能 作 
用 于 RNA 的 核酸 酶 ， 称 为 核糖 核酸 酶 (RNase); 只 能 作用 于 DNA 的 核酸 
酶 ， 为 脱氧 核糖 核酸 酶 (DNase), ， 有 些 核酸 酶 既 能 作用 于 RNA 也 能 作用 于 
DNA， 统 称 为 核酸 酶 (nuclease)。 根 据 切割 位 置 的 不 同 ， 又 可 将 核酸 酶 分 
为 核酸 外 切 酶 Cexonuclease) 和 核酸 内 切 酶 (endonuclease) 。 

核酸 外 切 酶 (exonuclease) 的 作用 是 从 分 子 链 的 末端 顺 次 水 解 磷酸 二 
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6. 2. 


BE ARERR. RIA 3'5 RSM ЯП 5 一 3' 核 酸 外 切 酶 。 例 
如 蛇毒 磷酸 二 酯 酶 是 3 一 5' 核 酸 外 切 酶 ， 嗜 酸 乳 杆菌 (Lactobacillus aci- 
dophilus) 核酸 酶 就 是 5' 一 3' 核 酸 外 切 酶 。 

核酸 内 切 酶 (endonuclease) 是 水 解 核酸 内 部 磷酸 二 酯 键 来 切断 核酸 。 
可 分 为 限制 性 核酸 内 切 酶 和 非特 异性 核酸 内 切 酶 。 一 般 都 不 具 碱 基 特 异性 ， 
但 也 有 限制 性 内 切 酶 能 够 识别 并 切断 特定 的 碱 基 或 碱 基 序列 的 酶 。 限 制 性 核 
酸 内 切 酶 (restriction endonuclease) 简称 限制 酶 ， 是 在 细菌 细胞 内 存在 的 
一 类 能 特异 性 识别 并 水 解 外 源 双 链 ОМА 的 核酸 内 切 酶 ， 可 用 于 特异 切割 
DNA， 常 作为 工具 酶 。 其 能 从 DNA 分 子 中 间 水 解 磷酸 二 酯 键 ， 从 而 切断 双 
链 DNA。 它 们 不 同 于 一 般 的 脱氧 核糖 核酸 酶 ， 切 点 严格 ， 要 求 专 一 的 核 苷 
酸 顺 序 。 在 科研 中 ， 难 以 深入 研究 的 DNA 大 分 子 ， 可 以 用 限制 性 内 切 酶 切 
割 成 特定 的 小 片段 来 进行 分 析 研 究 。 限 制 性 核酸 内 切 酶 的 发 现 ， 为 分 子 生物 
学 的 研究 开辟 了 新 的 途径 ， 已 成 为 必 不 可 少 的 工具 酶 。 


2 锌 指 核酸 酶 


锌 指 核酸 酶 由 锌 指 蛋白 和 一 个 非特 异性 核酸 内 切 酶 构成 。 锌 指 蛋 白 作为 
锌 指 核酸 酶 的 DNA 识别 域 ， 使 得 锌 指 核酸 酶 具有 特异 性 。 每 个 锌 指 结构 识 
别 并 结合 一 个 特异 的 三 联 体 碱 基 ， 改 变 锌 指 结构 的 氨基 酸 序列 ， 可 以 改变 锌 
指 核酸 酶 的 特异 性 ， 多 个 锌 指 结构 可 以 串联 起 来 ， 增 强 了 锌 指 核酸 酶 的 特异 
性 和 可 塑性 。1996 Æ, Kim 等 合成 了 第 一 个 锌 指 核酸 酶 ， 将 锌 指 蛋白 与 非 
特异 性 核酸 酶 Fok I Etk, AARP RRM Е, HORA ISTE. Ж 
中 的 非特 异性 核酸 内 切 酶 Fok I 是 来 自 海 床 黄 杆菌 的 一 种 限制 性 内 切 酶 ， 与 
锌 指 核酸 酶 连接 的 是 其 C 端的 96 个 氨基 酸 残 基 组 成 的 DNA 剪 切 域 。Fok I 
只 在 二 聚 体 状态 时 才 有 酶 切 活性 ， 当 两 个 锌 指 核酸 酶 的 识别 位 点 距离 6 一 
8bp 时 ， 会 产生 酶 切 作用 。 

锌 指 核酸 酶 技术 应 用 于 实际 的 科研 或 医疗 ， 还 有 许多 问题 需要 解 
决 。 首 先是 锌 指 核酸 酶 的 特异 性 。 二 聚 体 的 形成 是 独立 的 ， 同 源 二 聚 体 
和 异 源 二 聚 体 的 形成 都 可 以 形成 DNA 的 剪 切 ， 这 种 非特 异性 会 造成 毒 
ФЕ. Miller 等 和 Szczeoek 等 在 这 方面 做 了 很 多 工作 ， 构 建 了 一 系列 偏爱 
异 二 聚 体形 成 的 Fok 工 酶 ,但 这 种 情况 仍 不 能 完全 避免 ， 还 需要 继续 研 
究 。 其次， 引入 的 锌 指 核酸 酶 蛋白 是 不 是 会 引起 免疫 系统 的 反应 尚 不 明 
确 ， 到 目前 这 一 技术 只 能 取 自 身 细胞 ， 对 其 进行 体外 操作 ， 再 注 回 体 
内 。 锌 指 核酸 酶 的 设计 相对 于 其 他 蛋白 的 设计 更 加 有 利 ， 其 特异 性 较 好 
且 结构 保守 ， 在 治疗 人 类 遗传 疾病 上 有 极 大 的 应 用 价值 。 经 人 工 设计 自 
然 界 不 存在 的 蛋白 质 ， 用 于 科学 实验 、 基 因 治 疗 和 调控 ， 为 生物 学 及 医 
学 研究 开辟 了 新 的 领域 。 
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6.3 锌 指 核酸 酶 的 设计 


ZEN 是 作为 某 种 人 工 合成 的 限制 性 内 切 酶 对 特定 的 基因 起 作用 。 其 研 
究 方法 主要 是 通过 设计 ZFN 中 的 DNA 结合 区 域 (DNA binding domain, 
DBD) 来 识别 特定 的 ОМА 序列 ， 通 常 为 特定 的 目的 基因 序列 ， 进 而 与 非特 
异性 核酸 内 切 酶 融合 设计 ， 达 到 特异 性 核酸 内 切 酶 的 作用 。 如 果 把 锌 指 核 酸 
酶 应 用 于 基因 治疗 ， 则 主要 有 以 下 实验 步骤 : 首先 找 出 疾病 基因 突变 位 点 ， 
即 确定 靶 位 点 ， 然 后 根据 靶 位 点 进行 锌 指 核酸 酶 的 设计 并 检测 锌 指 核酸 酶 结 
A DNA 的 能 力 。 把 检测 合格 的 锌 指 核酸 酶 导入 到 细胞 内 ， 导 入 成 功 的 细胞 
注入 生物 体内 ， 进 行 生物 实验 。 


6.3.1 靶 位 点 的 确定 


锌 指 核酸 酶 (ZFN) 由 一 个 DNA 识别 域 和 一 个 非特 异性 核酸 内 切 酶 构 
成 。DNA 识别 域 是 由 一 系列 Cys2-His2 锌 指 蛋 白 Czinc-fingers) 串联 组 成 
(一 般 3 一 4 个) ， 每 个 锌 指 蛋白 识别 并 结合 一 个 特异 的 三 联 体 碱 基 。 由 于 锌 
指 核酸 酶 必须 形成 二 聚 体 〈 图 6.2) 才 具 有 活性 , 两 个 锌 指 DNA 结合 位 点 
就 识别 18 个 碱 基 ， 加 上 中 间 间 隔 的 6 个 碱 基 一 共 是 24 个 碱 基 ， 也 就 是 说 ， 
要 在 基因 上 寻找 一 段 24bp 的 DNA 序列 作为 锌 指 核酸 酶 的 靶 位 点 。 查 找 基 
因 序 列 的 相关 信息 ， 可 以 在 UCSC (University of California at Santa Cruz, 
http: //genome. исѕс. edu) X X 家 生物 信息 中 心 ( http: // 
www. ncbi. nlm. nih. gov) 上 查找 。 早 在 2003 年 ， 人 类 全 基因 组 测序 已 经 完 
成 ， 可 以 在 UCSC 的 网 站 上 查 到 。UCSC 主要 提供 的 是 基因 组 的 参考 序列 
和 相关 的 分 析 服 务 ， 还 提供 了 13 个 物种 中 的 CFTR 区 域 ， 分 为 几 个 不 同 的 
部 分 ， 包 括 Genome Browser、Gene Sorter、Bla 和 Table Browser， 分 别提 
供 了 基因 的 表达 信息 、 同 源 物 、 在 染色 体 上 所 处 的 位 置 ， 对 应 于 基因 组 中 的 
序列 包括 内 含 子 、 外 显 子 等 信息 。 


FokI 核 酸 
酶 结构 域 Ф 锌 指 核酸 酶 DNA 结 合 区 


半 个 目标 结合 位 点 ( 左 ) ”间隔 序列 半 个 目标 结合 位 点 ( 右 ) 


图 6.2 和 锌 指 核酸 酶 二 聚 体 结构 
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6.3.2 ZFN 蛋白 序列 的 设计 及 优化 


6.3.2.1 ZFN 序列 的 获取 
登陆 Scripps Research Institute 的 ZF tools 服务 器 http: //www. scripps. edu, 
提交 查找 好 的 靶 位 点 ， 设 定 相关 参数 ， 可 获取 ZEN 的 序列 。 


6.3.2.2 ZFN 核酸 序列 优化 

使 用 Primer Premier5. 0， 把 ZEN 氨基 酸 序 列 逆向 翻译 为 核酸 序列 。 对 
所 有 的 密码 子 进行 优化 ， 优 化 遵循 条 件 : 

© 考虑 到 设计 的 锌 指 核酸 酶 以 后 要 做 基因 表达 〈 一 般 用 真 核 表达 ) ， 要 
对 设计 好 的 核酸 序列 进行 第 选 ， 尽 量 选择 在 真 核 及 原核 细胞 内 均 可 有 效 表达 
的 密码 子 ， 对 大 肠 杆 菌 内 较 难 表达 的 密码 子 的 表达 阔 值 设 定 为 不 低 于 30%， 
以 利于 后 期 原核 表达 的 进行 。 从 密码 子 偏爱 性 方面 进行 分 析 ， 所 用 工具 为 网 
站 http: //gcua. schoedl. de/ 上 的 codon vs. usage table, 

Q 利用 密码 子 的 简 并 性 ， 尽 量 减 少 整个 序列 中 局 部 重复 序列 的 产生 ， 
以 利于 全 基因 合成 及 后 期 基因 克隆 操作 。 


6.3.2.3 ZFN 序列 的 特征 提取 及 结构 建 模 

利用 PSIPRED (http: //www. bioinf. cs. ucl. ac. uk/psipred) ， 对 ZFN 
蛋白 进行 特征 提取 及 结构 分 析 。PSIPRED 是 基于 神经 网 络 算法 的 蛋白 质 
二 级 结构 预测 软件 ， 平 均 准 确 率 为 78% ， 它 是 一 种 较为 准确 的 蛋白 质 二 
级 结构 预测 方法 。 利 用 Swiss-Model (http: //swissmodel. expasy. org/) 
和 Deep View (http: //www. expasy. org/spdbv) 进行 ZFN 的 三 级 结构 
同 源 建 模 。SWISS-MODEL 是 一 个 自动 化 的 蛋白 质 比较 建 模 服 务 器 ， 
DeepView 是 一 个 整合 工具 ， 用 于 观察 和 分 析 蛋 白质 结构 和 模型 。Swiss- 
Model 结构 合理 性 评估 有 三 种 方式 , 分 别 是 原子 间 经 验 平均 势 函数 
Anolea, Gromos 分 子 动力 学 以 及 表示 蛋白 质 残 基 与 结构 环境 匹配 的 
Verify3D 评估 。 


6.3.3 锌 指 核酸 酶 设计 举例 


以 镰刀 形 贫血 症 为 例 ， 设 计 用 于 基因 治疗 的 锌 指 核酸 酶 。 镰 刀 形 红细胞 
贫血 症 是 一 种 “分 子 病 ”， 即 分 子 结构 (特别 是 蛋白 质 分 子 结构 ) RERE 
性 变化 而 造成 的 病变 。 


6.3.3.1 确定 靶 位 点 

异常 血红 蛋白 B 链 的 第 6 位 谷 氨 酸 被 顷 氢 酸 所 代替 ， 因 此 我 们 先 要 找 出 
血红 蛋白 B 链 的 基因 。 登 陆 UCSC 网 站 主页 (http: //genome. ucsc. edu) 
进行 检索 ， 如 图 6. 3。 
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点 击 图 6. 3 中 的 “Genome Browser” 按 钮 ， 进 入 图 6.4 TRAM. ЖН 
应 的 设置 为 : Human、July 2003, НВВ, 620, 


UCSC Genome Bioinformatics 


es 


Shika ‘About the UCSC Genome Bioinformatics Site — 

сајан ‘Welcome to the UCSC Genome Browser website. This site contains the reference sequence and 
ENCODE portal to the ENCODE project. 

Ba — We encourage you to explore these sequences with our tools. The Genome Browser zooms and scr. 


Sorter shows expression, homology and other information on groups of genes that can be related 
Rui Browser promdes convenient access to the underlying database. VisiGene lets you browse throug) 
pattems Genome Graphs allows you to upload and display genome-wide data sets. 


The UCSC Genome Browser is developed and maintained by the Genome Bioinformatics Group, 
Engineering (CBSE) at the University of California Santa Cruz (UCSC). If you have feedback or 中 


图 6.3 UCSC 数据 库 网 站 主页 


点 击 图 6.4 FAY "submit", HAA 6. 5 所 示 界 面 。 图 中 显示 的 是 人 类 
11 号 染色 体 的 一 部 分 ， 包 含 HBB 基因 。 


图 6.4 寻找 人 类 血红 蛋白 B 链 DNA 的 参数 设置 


UCSC Genome Browser on Human July 2003 (NCBL34/hg16) Asseml 
aon ELLEI i pt E T, 


TT gree nee) we terr Cento ) 
OMNE нили вагини шшш I X) 


图 6.5 11 号 染色 体 的 一 部 分 , 包含 了 人 血红 蛋白 B 链 (HBB) 基因 


点 击 图 6.5 中 的 “HBB”， 可 以 获取 HBB 的 详细 信息 ， 如 图 6. 6。 点 击 
图 6. 6 中 的 “Genomic Sequence” 可 以 获取 HBB 的 DNA 序列 ， 如 图 6.7。 

在 图 6. 5 所 示 界面 的 下 方 找到 “Variation and Repeats”, 4p 6. 8 设 定 相 应 
的 参数 。 点 击 图 6.8 中 “refresh” 按 钮 ， 主 界面 就 会 出 现 更 多 的 信息 ， 如 图 6.9. 

点 击 图 6. 9 中 的 “rs334”， 可 进入 图 6.10 所 示 界 面 ， 由 图 6. 10 可 以 知 
道 突变 位 点 的 相关 信息 。 
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| ee 


‘UCSC Known Genes II (June 05, Based on hi? UCSC Known Genes) (NM. 000518) 
Outside Link: НМ 000518 

m MO RUN A 

вы 11p154 


беш бан: 1606 
Soma 


Docs last updated. 2005-06-30 


图 6.6 人 血红 蛋白 B 链 CHBB) 基因 的 详情 


»hgilé refüene mn 000518 rangeschrii:5211005-5212610 
'IITGCTTCTOACACAACIOTOTTCACT 


图 6.7 人 血红 蛋白 B 链 (HBB) 的 基因 序列 


Perlegen Haplotype Blocks 
MESS ете у [No фма-сһг11] ie hae 


анте Шш ets 


refresh | qu 


图 6.8 查找 变异 和 重组 部 分 的 基因 


гэс a а 10017004 IL ILLI 
chicken 
Takifugu rubr spes (mug. 2002/¢r1) Translated 
Fugu Biat 
Simple Macieot ide Ро тувогрп isas 
ез16098121 тЫ 
rsT«sesae | 
rs10768683 | 
"21799991 | 
511549405 | 


图 6.9 人 血红 蛋白 HBB 基因 的 多 态 性 
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Simple Nucleotide Polymorphism (SNP) rs334 


Position: chr! 1- 2 
Band: 11p15.4 
Genomic Size: | 


Sandar Ear at Suit: Nor Known 
Not Ki 
Functional Status: coding-nons: non, reference 


Validation Status: no-informatio; 


Meli 
pen in Assembly: catggtgcacctgactcctgAggagaagtctgccgttactg 
Alternate e:  catggtgcacctgactcctgTggagaagtctgccgttactg 
Variant Type: SNP 


Р 6.10 HBB 的 突变 基因 

6.3.3.2 ZFN 序列 的 获取 

由 于 镰刀 形 细 胞 贫血 病 的 突变 位 点 存在 于 血红 蛋白 B 链 的 第 一 个 外 显 子 
区 域 ， 我 们 考虑 将 第 一 个 外 显 子 整个 切除 ， 然 后 导 和 人 外 源 正 常 基因 进行 修 
复 。 即 要 设计 两 个 靶 位 点 : 一 个 位 于 基因 上 游 100bp 左右 ; 另外 一 个 位 于 
第 一 个 内 含 子 区 。 这 样 做 的 好 处 在 于 ， 即 使 在 DNA 的 接口 处 引入 突变 ， 也 
不 会 对 细胞 产生 太 大 的 影响 ， 因 为 在 血红 蛋白 B 链 基因 上 游 100bp 处 没有 其 
他 基因 ， 而 内 含 子 最 终 是 会 被 剪 切 掉 的 。 在 这 里 ， 我 们 只 举例 设计 第 一 个 靶 
位 点 的 锌 指 核酸 酶 。 目 前 ， 有 专门 设计 锌 指 蛋白 靶 位 点 的 网 站 http: // 
www. scripps. edu (图 6. 11) 。 在 网 页 中 输入 相应 的 DNA 序列 ， 设 定好 相 
应 的 要 求 ， 即 可 获得 一 些 可 以 作为 靶 位 点 的 DNA 序列 。 


Zine Finger Tooes 

See us aino at nctingertoots.orB. 

ZF Toolsnome Search DNA Sequence for Contiguous or Separated 
керю ы Target Sites 


Tools overview 

ома searcn pa Enter a DNA sequence to be scanned for target sites (10 kb max) 

ZFP design tps 一 

Avalabie triplets 

3yntnestte a ZFP 

Effector domains 

Nuclease design 

Cations ——À 

Triplets to search ZF set Minimum target size (bp) 

Send feedback ОМО Des d ILES 
EIGNACT) Search both srands — Hat-site size (bp) 

месото EON © Contiguous targets 

Sign out ATN O Separated targets (Cote отс bene or numon ote) 

Tio ^ C-terms ог Мат 

aE 


图 6. 11 主页 和 检索 工具 
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这 次 以 血红 蛋白 B 链 基因 上 游 100bp 内 靶 位 点 为 例 进行 设计 。 在 网 页 中 
输入 血红 蛋白 B 链 基因 上 游 100bp 的 序列 : 

tgtggagccacaccctagggttggccaatctactcccaggagcagggagggcaggagccagggctgg 
gcataaaagtcagggcagagccatctattg ctt 

选择 “Separated targets", Ad; "Submit", PAREWA, MA 
6. 12。 其 中 ， 红 色 的 碱 基 (图 中 标 以 斜体 ) 是 有 和 迭代 问题 的 ， 不 适合 作为 锌 
指 核酸 酶 的 靶 位 点 ， 如 图 6.12 中 所 列 的 第 四 个 靶 位 点 中 的 “GAG”。 在 众 
多 的 备 选 靶 位 点 选取 得 分 高 的 靶 位 点 ， 如 图 6.13 所 示 ， 选 取 了 得 分 最 高 的 
三 个 靶 位 点 用 于 后 续 实验 。 其 中 蓝 色 标记 的 碱 基 (图 中 标 以 黑体 〉 为 锌 指 的 
识别 位 点 ， 划 横 线 的 碱 基 为 核酸 酶 Fok I 的 作用 位 点 。 锌 指 核 酸 酶 的 核酸 
酶 结构 域 通常 选取 Fok I 核酸 酶 结构 域 。 


Forward Strand: 
Number of sites found: 19 


'8 Coverage map. The input sequence with every targetable base colored (top and bottom strands) 
5'-тотоодоссА CACCCTAGGS TTGECCAATC TACTCCCAGG AGCADOGACG осмәбарсса өоостооосА-3' 70 
3'-ACACCTCGGT GTGGEATCCC AACCOGTTAG ATGAGGUTCC тсётссстсс сотсстсөөт CCCORCCCET-—5 


Click here for a diagram of separated target sites like those used in nuclease design. 


Spans residues Score TSO lssues Parse ZFP Най sites and core sequence 
миме to top strand) sae v  Tripiets in rea Mouse over (or click on) mpiet for proie 


32 60.83 No 96 | 5'-САС ACC CTA GGGTTG ССС AAT СТА-3' 

9 3531 No - > 3'-GTG TGG GAT CCCAAC ССС TTA GAT-5" 

40 4532 No e b S'-AGG СТТ GGC CAATCT ACT ССС АСС-3' 

7 6083 No - b» 3'-TCC CAA CCG GTTAGA TGA GGG TCC-5" 

44 5311 No ++ P S'-TTG GCC AAT СТАСТС CCA GGA GCA-3' 

21 4947 No € b 3'-AAC ССС TTA GATGAG ССТ ССТ CGT-5' 

45 6111 Yes - DB S'-TGG ССА ATC TACTCC CAG (АС слс-з' i 

22 5839 No > b 3'-ACC GGT TAG ATGAGG GTC CTC GTC-5" 

图 6. 12 上 游 又 位 点 检索 的 部 分 结果 

57.67 No € bP 5'-CCC AGG AGC AGGGAG ССС АСС АСС-3' 
58.56 No # b 3'-GGG TCC TCG TCCCTC CCG ТСС TCG-5' 
5767 No = ВБ S'-AGG AGC AGG GAGGGC AGG AGC CAG-3" 
58.56 No = b 3'-TCC TCG TCC CTCCCG TCC TCG GTC-5" 
56.59 No € В 5'-GCC AGG GCT GGGCAT AAA AGT CAG-3" 
60.24 No = b 3'-CGG ТСС CGA CCCGTA TTT TCA GTC-5' 


图 6.13 上 游 靶 位 点 检索 得 分 最 高 的 三 组 结果 


点 击 箭头 标志 ， 可 以 进入 关于 对 应 该 位 点 的 锌 指 域 的 氨基 酸 序列 的 
网 页 ， 如 图 6. 14。 由 于 我 们 在 基因 上 游 100bp 选取 了 三 组 ， 最 终 我 们 得 
到 总 共 6 条 氨基 酸 序列 ( 表 6.1)。 其 中 粗 体 标记 的 氨基 酸 序列 对 应 
ян. 
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Using 49 mplets 
This target site does not have potential target site overlap issues (also consider TSO for 3 sequence to tis site) 


Requested target site is 
5' GGC AGG AGC 3" 


Perform a short nucieotide NCBI BLAST wath биз target sequence with the [ssa v genome 


Pop-up ELISA graphs on triple rolover. Yes No O. 
A ELIDA grape барит showy, ou can cache i mages (-1 5 wa ки) by скен [ne] 


Finger тре Hola. 
1 AGC ERSHLRE 
2 AGG — RSDHLTN 
3 GGC  DPGHLVR 


The amino acid sequence of the ZF protein predicted to bind to the target sequence is: с 
[LEPOEKPYKCPECOKSPSERSMLAENQRTHTOEKP YRCPECORST SRSDHLTHNORTHTOEKPYECPECOKSYSDPORL “| 
[ee А 


图 6.14 含 三 个 锌 指 结构 域 的 氨基 酸 序列 


表 6.1 上 游 三 组 锌 指 域 的 氨基 酸 序列 


跨度 预测 的 锌 指 蛋白 的 氨基 酸 序列 
LEPGEKPYKCPECGKSFSERSHLREHQRTHTGEKPYKCPECGKSFSRSDHLTNHQRTH 
TGEKPYKCPECGKSFSDPGHLVRHQRTHTGKKTS 
LEPGEKPYKCPECGKSFSRSDKLVRHQRTHTGEKPYKCPECGKSFSTKNSLTEHQRTH 
TGEKPYKCPECGKSFSTSGELVRHQRTHTGKKTS 
LEPGEKPYKCPECGKSFSRADNLTEHQRTHTGEKPYKCPECGKSFSERSHLREHQRTH 
TGEKPYKCPECGKSFSRSDHLTNHQRTHTGKKTS 
LEPGEKPYKCPECGKSFSTKNSLTEHQRTHTGEKPYKCPECGKSFSTSGELVRHQRTH 
TGEKPYKCPECGKSFSTKNSLTEHQRTHTGKKTS 
LEPGEKPYKCPECGKSFSRADNLTEHQRTHTGEKPYKCPECGKSFSHRTTLTNHQRTH 
TGEKPYKCPECGKSFSQRANLRAHQRTHTGKKTS 
LEPGEKPYKCPECGKSFSDPGHLVRHQRTHTGEKPYKCPECGKSFSTKNSLTEHQRT 
HTGEKPYKCPECGKSFSERSHLREHQRTHTGKKTS 
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6.3.3.3 ZFN 核酸 序列 优化 

把 ZFN 的 氨基 酸 序列 转化 成 核 苷 酸 序 列 。 用 Primer Premier5.0， 把 
ZFP 氨基 酸 序列 逆向 翻译 为 核酸 序列 。 打 开 Primer PremierS. 0 软件 ， 在 
File 中 选择 New 选项 中 的 Protein Sequence 选项 , 会 弹出 对 话 框 (图 
6. 15)。 在 空白 处 输入 蛋白 质 的 氨基 酸 序列 (以 第 一 条 氨基 酸 序列 为 例 )， 再 
点 击 “DNA” 键 ， 就 可 以 得 到 其 对 应 的 核 苷 酸 序列 (图 6.16)。 其 中 G、C 
分 别 代表 鸟 味 叭 和 胞 喀 啶 ，A、U SIRERE AREE, N 可 以 是 G、 
C, A, U 中 任何 一 种 碱 基 ; Y=C RU; R=G RA, 

去 掉 稀 有 密码 子 。 因 为 有 不 确定 的 碱 基 : NUEG, C, A, UE 
fj]— RE. Y=CR U, R=G 或 A。 根 据 表 达 载 体 并 尽量 避 开 稀有 密码 子 。 
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1  LEPCEKPYKC PECGKSFSER SHLAENQRTH ТОТИРҮКСРЕ COKSFSRSDH LTNHORTHTG 
61 ERPYRCPECG KSFSDPGHLV RHQRTHIGKK TS 


图 6.15 在 Primer Premier5. 0 中 输入 蛋白 质 序列 


Bg DIE 


6.16 从 Primer Premier5. 0 中 得 到 的 核 苷 酸 序列 


登陆 网 站 http: //gcua. schoedl. de/ (图 6.17)， 点 击 codon vs. usage ta- 
ble。 进 入 页 面 后 ， 输 入 相应 的 密码 子 (以 AAA 为 例 )， 选 择 表达 载体 〈 以 
大 肠 杆菌 为 例 )， 设 置 完 成 后 点 击 “Submit” 得 到 密码 子 的 使 用 频率 (图 
6.18)。 红 色 的 为 我 们 输入 的 密码 子 的 使 用 频率 。 按 照 这 种 方法 ， 对 编码 
ZFN 的 密码 子 进行 确定 和 检查 。 
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IK graphical powered by Г] 


www.rmrgene.com 
BK usage $0.39 /bp 4 
Da nalyser 0.30 € Љр ü 


Сома me for wave ватага oppor 


purpose 
Differences in codon usage preference among organisms lead to a variety of problems 
‘conceming heterologous gene expression but can be overcome by rational gene 
design and gene synthesis. The gcua tool displays the codon quality either in codon 
usage frequency values or relative adaptiveness values. 
each triplet position vs. usage table 
‘Submit a DNA sequence in raw or fasta format and choose a codon usage table. The 
sequence will be splitted in codons and the fraction of usage of each codon in the 
odon 


usage tables, you can submit your own by pasting in a http address. 
Ш an example... 
each codon vs. usage table 
Submit a DNA sequence in raw or fasta format and choose a codon usage table. The 
fraction of usage of each codon in the submitted sequence will be computed and 


plotted against the fraction of usage of the codon in the selected organism. 
Ш an example... 


图 6. 17 密码 子 数据 库 及 密码 子 偏好 性 分 析 软 件 主页 


EK graphical EN 
Эс odon —€— re Theni 
ШК usage ban 5 

Escherichia coli 
lila nalyser www.gcun de Н 


created: 16.09.2010 


Codontable (black): 
келема col 


Mean difference: 71.48 % 
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图 6.18 各 种 密码 子 在 大 肠 杆菌 中 的 使 用 频率 〈 见 彩 图 ) 


6.3.3.4 ZFN 序列 的 特征 提取 及 结构 建 模 
构建 的 锌 指 核酸 酶 二 级 结构 的 模拟 及 分 析 。 登 陆 PSIPRED 的 页 面 


http: //bioinf. cs. ucl. ac. uk/psipred/， 如 图 6. 19。 在 页 面 中 填 人 ZFN Ж 
白质 的 序列 ， 自 己 的 电子 邮箱 ， 点 击 页 面 中 间 的 “Predict” 命 令 ， 就 可 以 
完成 预测 。 以 第 1 条 ZEN 氨基 酸 序列 为 例 ， 输 入 氨基 酸 序列 ， 
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LEPGEK- 


PYKCPECGKSFSERSHLREHQRTHTGEKPYKCPECGKSFSRSDHLTNH 
QRTHTGEKPYKCPECGKSFSDPGHLVRHQRTHTGKKTS, 就 可 以 得 到 
预测 结果 ， 如 图 6. 20。 结 果 包 括 预测 的 可 信 度 评估 及 各 个 残 基 的 构象 。 


SbREPIPRED Protein Structure Prediction 


ШЫН 002 2288800222250, 


тез р. 
Pred: сссссссссссссссссссссссссинссссссссссссс 
AA: LEPGEKPYKCPECGKSFS ERSHLREHOR THTGEKPYKC PE. 


10 20 30 40 


cont: ase 0s. s08 7a r> 


i 
Pred: CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC 
АА: ССК SFSRS DHLTWHORTH TGEKP YKCPECCKSFSOPGH LY V 
зо во 70 зо 
Cont: зээ 
Pred: 


Pred: CCCCCCCCCCCC 
AA: RHORTHTCKKTS 
90 


Legend: 
Co) — helix conf: Lan lll — confidence of prediction 
= —straend ad etruétuns 


图 6. 20 PSIPRED 蛋白 质 二 级 结构 预测 结果 
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构建 的 锌 指 核酸 酶 三 级 结构 的 模拟 及 分 析 。 登 陆 SWISS-MODEL 服务 器 
的 web 界面 ， 如 图 6. 21。 其 共有 三 种 模式 : 自动 模式 (automated mode), HK 
MR (alignment), MAH (project mode)。 本 次 选取 自动 模式 。 


D. e | @ SWISS-MODEL 


图 6.21 SWISS-MODEL 服务 器 页 面 


在 Probide a protein sequence ог a UniProt AC Code 对 话 框 中 输入 需要 
预测 结构 的 蛋白 质 序列 ， 如 图 6. 22。 本 次 使 用 的 是 第 一 条 ZEN 的 氨基 酸 序 
列 ， 输 入 氨基 酸 序列 :LEPGEKPYKCPECGKSFSERSHLREHQRTHTGEK 
PYKCPECGKSFSRSDHLTNHQRTHTGEKPYKCPECGKSFSDPGHLVRH 
QRTHTGKKTS， 就 可 以 得 到 预测 结果 ， 如 图 6. 23. 

a4 Ø SWISS-MODEL Workspace 


Toda Rapontry Documentation 
Ж €» 
Saiesiodel Automate Modeling Mode © 


tr oo 
Ped m — —] 


— 


Prost a poten дса of a Unt АС Cote Ө 


图 6.22 SWISS-MODEL 服务 器 工作 界面 


在 结果 中 ， 建 模范 围 为 4.58， 目标 序列 与 模板 序列 的 相似 性 为 
87. 273%。 蛋 白质 的 结构 模型 也 可 以 通过 Deep View 查看 ， 点 击 “down- 
load”， 下 载 pdb 格式 的 文件 ， 然 后 下 载 Deep View 软件 ， 打 开 。 

在 出 现 建 模 结果 的 同时 ， 还 有 目标 蛋白 与 模板 结构 的 序列 联 配 信息 ， 如 
图 6.24; 结构 的 合理 性 评估 信息 ， 如 图 6. 25。 对 建 模 结果 的 评估 共有 三 种 ， 
用 on 和 off 来 控制 ， 本 次 实验 选取 了 全 部 三 种 评估 。 
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оен ЖП 


图 6.23 SWISS-MODEL 服务 器 的 建 模 结果 


Alignment Ө [op] 
TARGET 4 GEKPYKCPEC GKSFSERSHL 
imeyF 1 mekpykcpec gksfsqssnl qkhqrtht-- gekpykcpec gksfsqssdl 


TARGET sss sss hhhh 
lmeyF sss sss hhhh hhhhhhhh sss sss hhhh 
TARGET 24 REHQRTHIGE KPYKCPECGK SFSRSDHLTN HORTH 
imeyF 49 qkhgrthtge kpykcpecgk sfsrsdhlsr hqrthq 


TARGET hhhhhhhh sss sss hhhhhh hhhhh 
imeyF hhhh h sss з ss hhhhhh hhhhh 


图 6.24 SWISS-MODEL 服务 器 建 模 过 程 中 ， 目 标 序列 与 模板 序列 的 联 配 


Anolea | Gromos / Verify3D @ по] 
anoles: 9 on © of gomo: 9 on © of — verd: 9 on © off [show] 


m A ж m 
SexpvecrectksrsersHLREMORTHTGERPYKCPECOKS?SRSOMLTN 


图 6.25 SWISS-MODEL 服务 器 对 建 模 结果 的 部 分 评估 


下 载 的 pdb 格式 的 文件 可 以 用 Deep View 软件 打开 ,. 如 图 6. 26， 更 方 
便 对 结果 的 查看 和 分 析 。 本 次 试验 用 Deep View 软件 打开 的 就 是 第 1 条 
ZFN 氨基 酸 序列 。 图 6. 26 中 ， 红 色 区 域 为 a 螺旋 ， 蓝 色 为 B 折 释 ， 绿 色 为 
无 规则 卷曲 。 因 为 SWISS-MODEL 服务 器 建 模范 围 为 4.58， 并 没有 对 92 
个 氨基 酸 全 部 建 模 ， 这 在 Deep View 软件 中 可 以 清楚 地 看 到 。 
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图 6.26 Deep View 软件 工作 界面 (WEM) 


6.3.3.5 数据 分 析 

对 设计 的 不 同 组 的 锌 指 核酸 酶 进行 二 级 结构 和 三 级 结构 模拟 的 结果 进行 
评估 ， 确 定 合适 的 锌 指 核酸 酶 用 于 后 续 试 验 。 可 选择 在 结果 中 包含 一 份 蛋白 
质 校 验 工具 WhatCheck (http: //www. cmbi. kun. nl/gv/whatcheck ) 的 报 
f. 另外， 也 可 以 利用 服务 器 上 的 ANOLEA 原子 平均 势能 的 web Ж Cht- 
tp: //swissmodel. expasy. org/anolea) 检查 模型 的 质量 。 

随 着 科技 的 发 展 ， 模 拟 天 然 蛋 白质 的 结构 ， 人 工 设计 自然 界 不 存在 的 蛋 
白质 对 特定 基因 进行 调控 ， 为 现代 基因 治疗 的 发 展 提供 了 新 的 思路 。 锌 指 蛋 
白 依靠 其 特殊 的 锌 指 结构 域 来 识别 核酸 序列 ， 在 生物 体 中 起 到 了 重要 作用 。 
虽然 目前 锌 指 核酸 酶 技术 还 处 在 进一步 完善 阶段 ， 但 在 转基因 动 植物 的 研究 
和 应 用 方面 拥有 巨大 的 潜力 。 利 用 锌 指 核酸 酶 对 生物 基因 组 进行 靶 向 修饰 ， 
能 够 缩短 动 植物 优良 新 品种 的 培育 时 间 。 更 重要 的 是 ， 锌 指 核酸 酶 在 治疗 人 
类 遗传 疾病 方面 具有 极 大 的 应 用 价值 。 利 用 锌 指 核酸 酶 对 人 体 细胞 进行 靶 向 
修饰 ， 可 纠正 某 些 遗 传 缺 陷 ， 为 克服 许多 现 阶段 无 法 治愈 的 疾病 提供 一 个 强 
大 的 治疗 工具 。 
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7.1 导读 


近年 来 ， 诱 导 多 能 干细胞 研究 热潮 持续 高 涨 。 本 章 将 以 诱导 多 能 干细胞 
的 关键 转录 因子 Oct4 的 结构 模拟 为 例 ， 说 明 如 何 使 用 在 线 服 务 器 SWISS- 
MODEL 对 蛋白 质 进行 同 源 建 模 。 

干细胞 是 一 种 具有 自我 更 新 能 力 和 分 化 潜能 的 细胞 ， 可 根据 分 化 潜能 的 
大 小 不 同 或 者 来 源 不 同 进行 分 类 。 其 中 ， 胚 胎 干细胞 由 于 在 人 类 组 织 或 器 官 
修复 及 替代 等 医学 问题 上 具有 巨大 的 临床 应 用 前 景 而 备 受 关注 。 但 胚胎 干 细 
胞 临床 应 用 研究 在 一 定 程度 上 受 限 于 伦理 问题 及 免疫 排斥 问题 。 

近年 来 ， 诱 导 多 能 干细胞 研究 热潮 持续 高 涨 ， 该 技术 的 出 现 有 效 地 回避 
了 胚胎 干细胞 研究 所 面 对 的 上 述 两 大 难题 ， 推 动 干细胞 临床 应 用 向 前 迈进 一 
大 步 。 在 诱导 多 能 干细胞 过 程 中 ， 转 录 因 子 Oct4 发 挥 着 关键 作用 。 

蛋白 质 的 结构 决定 功能 。 对 蛋白 质 结构 的 解析 ， 无 疑 能 够 更 深入 地 了 解 该 
蛋白 的 性 质 及 功能 ， 进 而 有 助 于 阐明 其 作用 的 分 子 机 理 。 目 前 对 于 蛋白 质 三 维 
结构 的 研究 方法 主要 可 分 为 两 大 类 : 实验 方法 及 计算 机 预测 方法 。 在 计算 机 预 
测 方法 中 ， 同 源 模拟 法 是 目前 为 止 预 测 最 为 成 功 、 准 确 度 最 高 的 方法 。SWISS- 
MODEL 是 目前 使 用 最 广泛 的 免费 在 线 同 源 建 模 服务 器 之 一 。 在 本 章 7.8 节 即 利 
用 SWISS-MODEL 中 的 全 自动 模式 对 Oct4 的 POUs 结构 域 进行 同 源 建 模 。 


7.2 干细胞 


“干细胞 ”一 词 最 早出 现 于 19 世纪 ，1896 ^E, Wilson 第 一 次 用 到 “ 干 细 
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胞 ”这 个 名 词 ， 专 指 寄 生性 蠕虫 (如 量 虫 生殖 系统 ) 的 早期 细胞 。 当 时 人 们 
对 干细胞 的 理解 仅 限于 能 够 产生 子 代 细 胞 的 一 种 较 原始 的 细胞 。 目 前 认为 干 
细胞 是 一 种 具有 自我 更 新 (self-renewal) 能 力 和 分 化 〈differentiation) Ж 
能 的 细胞 。 

根据 分 化 潜能 的 大 小 , 干细胞 可 分 为 全 能 干细胞 (totipotent stem 
cell) 、 多 功能 干细胞 (pluripotent stem cell)、 多 潜能 干细胞 (multipotent 
stem cell) 和 单 能 干细胞 (unipotent stem cell)。 根 据 来 源 不 同 , 干细胞 又 
可 分 为 胚胎 干细胞 (embryonic stem cell) 和 成 体 干细胞 (adult stem cell). 

卵子 和 精子 融合 产生 受精 卵 ， 受 精 卵 在 形成 胚胎 过 程 中 四 细胞 期 之 前 任 
一 细胞 皆 是 全 能 干细胞 ， 具 有 发 育成 独立 个 体 的 能 力 〈 图 7. 1)。 多 功能 干 
细胞 是 全 能 干细胞 的 后 裔 ， 无 法 发 育成 一 个 个 体 ， 但 具有 发 育成 多 种 组 织 的 
能 力 。 多 潜能 干细胞 只 能 分 化 成 特定 组 织 或 器 官 等 特定 族群 (例如 血细胞 ， 
包括 红 血 细胞 、 白 血细胞 和 血小板 )。 单 能 干细胞 只 能 产生 一 种 细胞 类 型 ， 
但 是 自 更 新 属性 将 其 与 非 干 细胞 区 分 开 。 


图 7.1 具有 不 同 分 化 潜能 的 人 类 干细胞 


胚胎 干细胞 是 在 胚胎 发 育 早期 的 宫 胚 中 ， 可 发 育 为 各 种 功能 细胞 的 细 
胞 ， 是 所 有 细胞 最 初期 的 形态 。 成 体 干 细胞 亦 称 成 人 干细胞 ， 它 们 存在 于 成 
体 特定 的 组 织 中 ， 可 以 分 化 成 具 特 定 功能 的 细胞 ， 例 如 骨髓 干细胞 、 造 血 干 
细胞 、 神 经 干细胞 。 现 在 医学 上 常用 的 成 体 干细胞 大 致 包括 骨髓 干细胞 、 脐 
带 血 干细胞 及 周边 血 干 细胞 。 

在 各 种 干细胞 的 研究 与 应 用 中 ， 胚 胎 干细胞 最 引 人 注 目 。 最 新 的 研究 表 
明 ， 利 用 胚胎 干细胞 自我 更 新 、 高 度 增殖 和 多 向 分 化 的 能 力 ， 结 合 现代 生物 
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医学 及 工程 技术 ， 有 可 能 实现 人 类 组 织 或 器 官 的 修复 及 替代 。 该 领域 的 研究 
几乎 涉及 人 体 所 有 的 重要 组 织 和 器 官 ， 也 涉及 人 类 面临 的 大 多 数 医 学 难题 ， 
如 : 成 分 输血 ， 意 外 损伤 患者 的 植皮 、 关 节 置 换 ， 糖 尿 病 患者 的 胰腺 植 人 ， 
心脏 病 患者 的 瓣膜 置换 ， 癌 症 患 者 手术 切除 后 组 织 或 器 官 的 替代 ， 大 剂量 放 
化 疗 后 造血 与 免疫 功能 重建 ， 肝 、 肾 等 重要 器 官 损伤 或 功能 衰竭 后 的 置换 ， 
部 分 遗传 缺陷 性 疾病 的 治疗 等 。 

可 胚胎 干细胞 研究 也 一 直 是 一 个 颇具 争议 的 领域 。 支 持 者 认为 这 项 研究 
有 助 于 根治 很 多 疑难 杂 症 ， 是 一 种 挽救 生命 的 慈善 行为 ， 是 科学 进步 的 表 
现 。 而 反对 者 则 认为 ， 进 行 胚胎 干细胞 研究 就 必须 破坏 胚胎 (获取 胚胎 干 细 
胞 需要 在 胚 泡 阶 段 破坏 胚胎 ， 以 提取 内 细胞 团 ) ， 而 胚胎 是 人 尚未 成 形 时 在 
子宫 内 的 生命 形式 。 因 此 ， 如 果 支 持 进行 胚胎 干细胞 研究 就 等 于 是 众生 他 人 
“扼杀 生命 "， 这 种 行为 是 不 道德 的 ， 是 违背 伦理 的 。 

此 外 ， 胚 胎 干 细胞 的 临床 应 用 本 身 也 存在 严重 的 问题 。 从 胚胎 干细胞 分 
化 得 到 的 各 种 细胞 和 组 织 如 果 不 是 由 受 体 提 供 的 体 细胞 核 移 植 所 得 ， 那 么 将 
会 与 受 体 发 生 免疫 排斥 反应 。 胚胎 干细胞 的 抗原 性 可 能 没有 成 熟 细胞 强 ， 但 
随 着 胚胎 干细胞 向 成 熟 细胞 的 分 化 ， 抗 原 性 将 逐渐 表现 出 来 。 

近年 来 一 项 攻 勃 发 展 的 技术 一 一 诱导 多 能 干细胞 技术 ， 可 以 说 有 效 地 回 
避 了 胚胎 干细胞 研究 所 面临 的 上 述 两 大 问题 ， 该 技术 的 出 现 使 干细胞 研究 登 

一 个 新 的 平台 ， 并 使 干细胞 的 临床 应 用 又 向 前 迈 了 一 大 步 。 


З 诱导 多 能 干细胞 


2006 年 ， 日 本 京都 大 学 的 Yamanaka 和 Takahashi 在 《细胞 》 杂 志 上 发 
表 一 项 研究 。 他 们 将 4 种 转录 因子 Осы, Sox2, c-Myc 和 КМ 导入 小 鼠 皮 
肤 纤维 母 细胞 ， 发 现 可 诱导 该 成 熟 细 胞 发 生 转 化 ， 产 生 的 细胞 在 形态 、 基 因 
表达 、 表 观 遗 传 修饰 状态 、 细 胞 倍增 能 力 、 类 胚 体 和 畸形 瘤 生成 能 力 及 分 化 
能 力 等 方面 都 与 胚胎 干细胞 极为 相似 。 
他 们 将 这 种 细胞 命名 为 诱导 多 能 干细胞 
Cinduced pluripotent stem cells, iPS 4 


eg, ю ойто. 
随后 ， 美 国 几 家 实验 室 也 陆续 建 


кинни ips 细 胸 2007 32 iPS 细胞 。2007 年 11 月 下 旬 ， 美 
mn ФӘ D ^ Thompson 实验 室 和 Yamanaka 实验 室 
几乎 同时 报道 ， 利 用 iPS 技术 同样 可 以 


图 7.2 诱导 多 能 干细胞 
诱导 人 皮肤 纤维 母 细胞 转变 成 为 几乎 


与 胚胎 干细胞 完全 一 样 的 多 能 干细胞 (图 7. 3) ， 所 不 同 的 是 ，Yamanaka ЗЕ 
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验 室 依然 采用 了 用 逆转 录 病 毒 导入 Осм. Sox2, с-Мус 和 КІМ 这 4 种 转录 
AF. mi Thompson 实验 室 则 采用 了 以 慢 病 毒 载体 导入 Oct4、Sox2 
Nanog 和 Lin28 这 4 种 转录 因子 。 


图 7.3 人 类 iPS 细胞 群落 图 7.4 iPS 细胞 发 育成 的 小 鼠 “ 小 小 ” 


2008 4E, iPS 研究 热潮 持续 高 涨 ， 并 取得 了 多 项 令 人 瞩目 的 进展 。 哈 佛 
大 学 George Daley 实验 室 利用 iPS HAIER A 10 名 不 同 遗 传 病 患者 身上 的 
皮肤 细胞 转变 为 IPS 细胞 ， 这 些 细胞 将 会 在 建立 疾病 模型 、 药 物 筛选 等 方面 
发 挥 重要 作用 。 哈 佛 大 学 另 一 家 实验 室 则 发 现 利用 病毒 将 3 种 在 细胞 发 育 过 
程 中 起 重要 作用 的 转录 因子 引入 小 鼠 胰 腺 外 分 泌 细 胞 ， 可 以 直接 诱导 其 转变 
成 与 干细胞 极为 相似 的 细胞 ， 并 且 可 以 分 刻 胰 岛 素 。 这 表明 利用 诱导 重新 编 
程 技术 可 以 直接 获得 某 一 特定 类 型 的 组 织 细胞 ， 而 不 必 先 经 过 诱导 多 功能 干 
细胞 这 一 步 。 

2008 年 底 ，Huangfu 等 利用 小 分 子 丙 戊 酸 (valproic acid, VPA) 和 两 
种 转录 因子 Oct4 及 Sox2 成 功 诱导 出 iPS 细胞 ， 且 诱导 效率 大 大 提高 Kt 
究 去 除了 c-Myc 和 КИ4 这 两 个 有 致 瘤 风 险 的 因子 ， 大 大 提高 了 IPS 细胞 应 
用 于 临床 的 可 能 性 。 另 外 ，VPA 的 引入 提示 ， 或 许可 以 选择 出 合适 的 小 分 
子 物质 来 完全 代替 外 源 基因 的 导入 ， 从 而 避免 对 人 类 基因 组 的 扰乱 ,使 iPS 
细胞 应 用 于 临床 变 得 更 加 安全 可 行 。 

2009 年 初 ， 在 转录 因子 的 研究 方面 又 取得 了 新 的 突破 。Kim 等 研究 表 
明 ， 只 需要 Oct4 这 一 个 转录 因子 就 可 以 使 成 年 小 鼠 的 神经 干细胞 重新 编程 
转变 为 iPS 细胞 。 该 研究 小 组 将 Oct4 以 逆转 录 病 毒 为 载体 转 染 入 小 鼠 神经 
干细胞 ， 成 功 获得 iPS 细胞 ， 这 些 细 胞 在 体外 可 以 诱导 分 化 为 神经 干细胞 、 
心肌 细胞 和 生殖 细胞 。 更 少 因子 的 使 用 意味 着 更 少 的 遗传 操作 ， 这 将 会 相应 
提高 iPS 细胞 临床 应 用 的 安全 性 。 同 年 ， 该 小 组 用 功能 性 的 蛋白 质 (Oct4、 
Sox2, c-Myc 和 Klf4) 取代 过 表达 的 四 个 转录 因子 ， 也 成 功 诱导 出 IPS 细 
胞 。 因 为 在 诱导 IPS 后 蛋白 质 会 慢 慢 降解 ， 所 以 大 大 降低 了 致癌 可 能 性 ， 从 
而 进一步 促进 该 技术 的 临床 应 用 。 
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目前 猴 、 大 鼠 和 猪 的 IPS 细胞 也 都 成 功 建立 ， 证 明了 不 同 物种 之 间 有 着 
高 度 的 同 源 性 及 保守 的 维持 发 育 多 能 性 的 机 制 。 

在 这 项 iPS 研究 热潮 中 中 国 后 来 居 上 甚至 走 到 了 世界 的 前 列 。2007 年 ， 
中 国 科学 院 广州 生物 医药 与 健康 研究 院 华南 干细胞 与 再 生 医 学 研究 所 采用 北 
转录 病毒 载体 导 人 4 种 转录 因子 一 一 Oct4、Sox2、c-Myc 和 КИА, ЖР 
型 小 鼠 成 纤维 细胞 改造 成 iPS 细胞 。2009 年 1 月 ， 肖 奉 研 究 组 成 功 诱导 出 
KE iPS 细胞 。 同 年 ， 中 国 科学 院 动物 研究 所 周 琪 研究 组 和 上 海 交通 大 学 医 
学 院 曾 凡 一 研究 组 利用 IPS 细胞 ， 通 过 四 倍 体 训 胚 注 射 得 到 存活 并 具有 繁殖 
能 力 的 小 鼠 “ 小 小 ” (图 7.4)， 在 世界 上 首次 证 明了 iPS 细胞 的 全 能 性 。 
“小 小 ”的 出 生 立 即 人 选美 国 《 时 代 周 刊 》 公 布 的 当年 十 大 医学 突破 。 英国 
《自然 》 杂 志 报 道 称 ， 中 国 科 学 家 “为 克隆 成 年 哺乳 动物 开辟 了 一 条 全 新 道 
路 "， 并 指出 “该 方法 比 传统 克隆 方法 更 高 效 、 更 安全 ， 会 引起 人 们 对 治疗 
性 克隆 的 兴趣 ”。 

iPS 技术 的 出 现 为 研究 细胞 核 重 新 编程 开辟 了 一 条 新 途径 ,同时 也 给 再 生 
医学 带 来 了 新 的 希望 。iPS 技术 证 实 了 既往 所 认为 的 处 于 终 末 分 化 的 成 熟 细 胞 
可 通过 导 和 人 外 源 转录 因子 基因 而 发 生 重新 编程 ， 恢 复 多 分 化 潜能 。 而 且 与 经 
典 的 胚胎 干细胞 技术 和 体 细 胞 核 移 植 技术 相 比 ，iPS 技术 不 使 用 胚胎 细胞 或 卵 
细胞 ， 因 此 回避 了 一 直 以 来 争论 不 休 的 伦理 学 问题 。 此 外 ，iPS 技术 可 以 利用 
病人 自己 的 体 细胞 制备 专用 的 干细胞 ， 所 以 不 具有 器 官 移植 中 的 免疫 排斥 问 
题 。 鉴 于 此 ， 该 技术 自 2006 年 一 经 报道 ， 便 立刻 引起 科学 界 甚至 媒体 界 的 麦 
动 。2007 年 ，iPS 技术 更 是 人 选美 国 《 科 学 》 杂志 年 度 十 大 科技 突破 。 


7.4 转录 因子 Oct4 


转录 因子 Oct4 发 现 于 1989 年 ， 这 是 一 种 定位 于 细胞 核 内 ， 调 控 哺乳 类 
胚胎 发 育 的 关键 分 子 ， 也 是 维持 胚胎 干细胞 不 分 化 及 自我 更 新 的 关键 分 子 。 

Oct4 由 定位 于 人 类 染色 体 6p21. 3 上 的 Pou5fl 基因 编码 产生 。 该 蛋白 
Ж РОО (Pit-Oct-Unc) 结构 域 的 转录 因子 家 族 中 的 一 员 ， 属于 POU Ж 
白 家 族 7 个 亚 族 的 第 V 亚 族 ， 在 不 同 物种 间 具 有 高 度 保守 性 ， 含 有 家 族 的 保 
守 区 POU 结构 域 。 

POU 结构 域 是 DNA 双向 结合 结构 域 ， 包 括 两 部 分 POU 特异 域 
(POU-specific domain, POUs 结构 域 ) 和 POU 同 源 域 (POU-homeo do- 
main，POUHp 结 构 域 ) 。POUs 结 构 域 位 于 N ж, НЯ АДИЕВ Е 
的 75 个 氨基 酸 组 成 。POUrp 结 构 域 位 于 C. Hi A AER. ARAI 
氨 酸 的 约 60 个 氨基 酸 组 成 。 这 两 个 亚 区 间 由 长 度 可 变 的 柔性 连接 肽 din- 
ker) 连接 ,使 它们 可 以 通过 螺旋 -转角 -螺旋 (HTH) 模 序 结合 到 DNA 结 
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合 位 点 上 ， 激 活 启动 子 或 增强 子 区 域内 带 有 顺 式 反 应 元 件 的 基因 表达 。 后 者 
的 特征 性 结构 为 ATGCAAAT 八 聚 体 结构 ， 又 称 Oct 结构 。Oct4 通过 结合 
含 ATGCAAAT 的 八 聚 体 结构 而 活化 相应 靶 基 因 ， 激 活 或 抑制 干细胞 分 化 
过 程 中 相关 基因 的 表达 。POU 结构 域 以 外 的 氨基 酸 序列 对 Oct4 结合 到 
DNA 上 不 是 必需 的 ， 并 且 表 现 出 较 少 的 序列 保守 性 。 

Oct4 是 细胞 全 能 性 的 标志 ， 也 是 维持 细胞 多 能 性 的 重要 转录 因子 ， 通 
过 调控 下 游 靶 基因 而 参与 正常 发 育 过 程 ， 尤 其 在 早期 胚胎 发 育 中 起 重要 作 
用 。 它 诱导 表达 的 靶 基 因 产 物 是 成 纤维 母 细胞 生长 因子 -4 C fibroblast 
growth factor-4, FGF-4) 等 ， 能 够 通过 生长 因子 的 旁 分 泌 作 用 调节 干细胞 
WBA ES CAE Е РЧЫ. ABR АШ) Oct4 基因 后 ， 细 胞 不 再 分 化 成 内 
细胞 团 ， 而 只 能 发 育 到 讼 胚 期 ， 小 鼠 胚 胎 附 植 后 不 久 死亡 。 但 在 胚 泡 形成 之 
前 抑制 Oct4 功能 并 不 影响 孵 裂 球 细胞 全 能 性 ， 这 表明 早期 鼠 胚 中 Осы 只 有 
在 内 细胞 团 变 成 滋养 层 细胞 阶段 为 维持 其 全 能 性 表 型 而 发 挥 作用 。Oct4 的 
精确 表达 是 维持 胚胎 干细胞 多 能 性 的 重要 指标 ， 过 表达 或 低 表 达 都 会 改变 胚 
胎 干细胞 的 自我 更 新 状态 。Oct4 通过 与 其 他 转录 因子 如 Sox2、FoxD3 结 
合 ， 共 同 作 用 于 许多 下 游 披 基因 的 启动 子 或 增强 子 ， 正 / 负 调 控 下 游 靶 基因 
的 表达 ， 从 而 维持 胚胎 干细胞 的 自我 更 新 状态 。 

近 几 年 ， 许 多 研究 还 发 现 Oct4 也 表达 于 多 种 成 体 干细胞 中 ， 如 来 源 于 
乳腺 、 胰 腺 、 肝 和 肾 的 干细胞 以 及 毛囊 干细胞 、 间 充 质 干 细胞 和 神经 祖 细胞 
等 。Hochedlinger 等 研究 发 现 异 位 表达 Oct4 基因 可 引起 上 皮 细 胞 异常 增生 ， 
可 能 与 肿瘤 形成 有 密切 的 关系 。 而 近 几 年 研究 也 发 现 Oct4 基因 表达 于 膀胱 
瘤 、 乳 腺 癌 、 胰 腺 瘤 、 骨 和 软骨 瘤 中 ， 但 在 正常 组 织 中 不 表达 。 作 为 胚胎 干 
细胞 的 特异 性 基因 ，Oct4 在 肿瘤 中 的 表达 提示 细胞 癌变 过 程 中 可 能 存在 胚 
胎 基因 的 激活 ， 也 有 研究 者 认为 这 是 干细胞 致癌 的 一 种 证 据 ， 换 句 话 说 
Oct4 基因 可 能 是 一 个 潜在 的 癌 干 细胞 标记 物 。 

然而 ，Leendert 等 利用 100 多 种 肿瘤 组 织 芯片 对 Oct4 基因 进行 表达 情 
况 第 查 时 却 发 现 ， 该 基因 在 非 生殖 细胞 肿瘤 中 几乎 不 表达 。 此 外 ， 部 分 研究 
者 质疑 Oct4 蛋白 在 非 胚胎 性 肿瘤 细胞 系 和 组 织 中 的 表达 可 能 是 假 基因 和 亚 
型 (isoforms) 的 影响 ， 其 至 认为 是 实验 过 程 中 对 照 设置 不 合理 ， 过 度 曝 光 
造成 的 。 因 此 ，Oct4 基因 在 成 体 肿瘤 细胞 中 是 否 表 达 尚 有 争议 ， 这 方面 的 
探究 工作 正在 积极 开展 中 。 


7.5 转录 因子 Оси 结构 解析 的 意义 


由 于 iPS 技术 回避 了 胚胎 干细胞 研究 所 带 来 的 伦理 问题 ， 而 且 其 能 产生 
个 体 特异 的 细胞 群 ， 从 而 可 以 避免 免疫 排斥 反应 ， 因 而 该 技术 在 提出 后 受到 
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科学 家 及 临床 研究 工作 者 的 广泛 关注 。 但 是 在 IPS 细胞 正式 进入 临床 使 用 之 
前 还 有 许多 疑惑 需要 解答 ， 而 iPS 细胞 重新 编程 的 分 子 机 制 便 是 首先 需要 和 弄 
清楚 的 。 

目前 科学 家 们 正 从 细胞 信号 通路 、small RNA、 转 录 因子 及 表 观 遗传 等 
不 同 角度 研究 iPS 细胞 重新 编程 的 机 理 ， 以 及 iPS 细胞 自我 更 新 、 增 殖 及 分 
化 的 机 理 。 在 众多 研究 当中 ，Oct4 一 直 被 认为 是 不 可 或 缺 的 转录 因子 ， 在 
重 编程 起 始 过 程 中 起 到 关键 作用 。 如 Kim 等 研究 表明 : 只 需要 Oct4 这 一 个 
转录 因子 就 可 以 诱导 成 年 小 鼠 的 神经 干细胞 重新 编程 转变 为 iPS 细胞 。 

此 外 ，Oct4 的 精确 表达 也 是 维持 胚胎 干细胞 多 能 性 的 重要 指标 ， 过 表 
达 或 低 表 达 都 会 改变 胚胎 干细胞 的 自我 更 新 状态 。 科 学 家 们 也 正 积极 探究 
Oct 转录 因子 与 相关 辅 因子 协同 调控 下 游 基因 表达 的 分 子 机 制 。 而 Oct4 能 
否 作 为 肿瘤 干细胞 的 标志 ， 近 年 来 也 在 热烈 探讨 中 。 

蛋白 质 的 结构 决定 功能 。 对 Oct4 结构 的 解析 ， 无 疑 可 以 更 深入 地 了 解 
该 蛋白 质 的 性 质 及 功能 ， 进 而 有 助 于 阐明 其 与 辅 因子 及 下 游 靶 基因 作用 的 分 
子 机 理 。 这 对 揭示 Oct4 维持 胚胎 干细胞 自我 更 新 状态 的 机 制 ， 诱 导 多 能 干 
细胞 机 制 ， 肿 瘤 干细胞 标志 甚至 肿瘤 发 生机 制 等 重大 科学 问题 无 疑 会 有 巨大 
的 推动 作用 。 

Oct4 的 POUHDp 结 构 域 的 溶解 状态 在 1995 年 已 被 Morita 等 用 NMR 的 
方法 测定 出 来 ， 但 是 至 今 还 没有 POUs 结构 域 的 具体 资料 。 而 POU 家 族 的 
原初 成 员 Octl 的 POUs Ж POUHDp 结 构 域 均 已 在 1999 年 被 测 出 (图 7.5， 
图 7.6)。 现 已 证 实 ，Oct4 的 POU 结构 域 与 Octl 有 约 60% 相 似 ， 并 且 Оси 
与 Oct4 的 相互 作用 具有 协同 特征 。 因 此 ， 目 前 一 些 针 对 Oct4 及 其 辅 因子 协 
同调 控 下 游 技 基因 表达 的 分 子 机 制 的 研究 ， 正 是 先 分 析 Octl1/ 辅 因子 /DNA 
三 元 复合 体 的 结构 ， 再 通过 计算 机 同 源 模拟 建立 Oct4/ 辅 因子 /DNA 三 元 复 
合体 模型 的 方法 进行 。 


图 7.5 Octl-POU 结构 域 /OCA-B 图 7.6 Octl-POU 结构 域 /Sox2/DNA 
肽 /DNA 三 元 复合 物 结构 示意 图 三 元 复合 物 结构 示意 图 
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7.6 蛋白 质 三 维 结构 研究 方法 


目前 蛋白 质 结构 的 研究 方法 ， 主 要 可 分 为 两 大 类 : 一 是 利用 实验 的 方 
法 ， 包 括 以 X 射线 衍射 (X-ray diffraction) 或 用 核磁 共振 (nuclear mag- 
netic resonance, NMR) 的 方法 建立 蛋白 质 结构 模型 ， 另 一 则 是 利用 计算 
机 ， 依 据 现 有 的 结构 信息 结合 理论 运算 ,对 蛋白 质 进行 未 知 结构 预测 。 预 测 
方法 包括 同 源 模拟 法 (homology modeling), HHP AH (folding recogni- 
tion) 以 及 从 头 算法 (ab initio). 三 种 。 

CD X 射线 衍射 ”利用 光 的 衍射 特性 ， 以 X 射线 照射 形成 晶体 的 蛋白 
质 ， 产 生 衍射 图 谱 ， 再 对 此 平面 图 谱 进 行 一 连 串 的 计算 分 析 ， 取 得 晶体 的 像 
fi (phase angle)， 最 后 建立 蛋白 质 结构 模型 。X 射线 衍射 法 是 目前 获得 蛋 
白质 三 维 结构 的 主要 途径 , 但 其 缺点 是 约 有 50% 的 蛋白 质 不 易 取得 晶体 ， 
且 蛋 白质 纯化 过 程 也 有 难度 ， 这 就 需要 更 进一步 改进 表达 系统 (expression 
system) 及 结晶 方法 ， 以 加 速 蛋 白质 结构 的 解析 。 

(2) 核磁 共振 ”利用 电子 的 自 旋 (spin) 特性 ， 以 外 加 磁场 改变 其 自 旋 方 
式 ， 夭 此 获得 蛋白 质 的 电子 图 谱 ， 根 据 取 得 的 数值 计算 蛋白 质 结构 。 由 于 NMR 
解 出 来 的 结构 是 蛋白 质 在 水 溶液 中 的 状态 ， 属 于 动态 模拟 方式 ， 因 而 可 以 得 到 
20~40 种 模型 ， 最 后 经 过 运算 取得 平均 结构 。 由 NMR 的 结果 ， 可 以 模拟 蛋白 质 
在 体内 的 动态 结构 。 但 由 于 共振 仪 及 信号 强度 的 限制 ，NMR 能 解 出 结构 的 蛋白 
质 分 子 量 约 在 10kDa， 约 为 100 个 氨基 酸 ， 所 以 蛋白 质 的 长 度 限 制 了 该 方法 的 应 
用 ， 若 能 提升 NMR 的 解析 能 力 ， 蛋 白质 结构 的 取得 可 快速 增加 。 

(3) 同 源 模拟 法 ”将 目标 蛋白 序列 与 现存 于 蛋白 质 结构 数据 库 中 的 已 知 
序列 进行 比 对 ， 找 出 最 好 的 三 维 结构 模板 〈template) ， 以 此 模板 为 模型 将 
目标 序列 导入 后 ， 取 得 后 者 的 三 维 结构 模型 ， 经 分 子 动能 (molecular dy- 
namics) 及 能 量 最 小 化 (energy minimization) 运算 ， 最 后 可 获得 目标 序列 
的 蛋白 质 结构 。 同 源 模拟 法 的 缺点 是 当 现存 数据 库 中 没有 类 似 的 结构 序列 或 
序列 相似 度 较 低 (二 30%〉 时， 就 无 法 以 此 方法 进行 预测 ， 即 使 强行 预测 ， 
结果 的 可 信 度 也 不 高 。 

(4) 折 倒 辨识 法 ”将 目标 序列 分 区 段 代入 已 知 蛋 白质 结构 序列 相似 的 模 
板 ， 观 察 两 者 在 某 一 区 域内 的 相似 度 ， 经 能 量 最 小 化 运算 ， 找 出 符合 要 求 的 
分 子 。 该 方法 需 耗 费 大 量 的 计算 资源 ， 对 于 蛋白 质 的 核心 部 分 具有 较 高 的 准 
确 度 ， 而 外 围 的 准确 度 则 较 差 。 

O 从 头 算法 ”根据 分 子 动力 学 原理 ， 考 虑 氨基 酸 和 溶液 的 所 有 交互 作 
用 力 ， 找 出 分 子 间 最 稳定 的 状态 ， 由 一 级 结构 开始 ， 计 算出 蛋白 质 的 三 级 结 
构 。 该 方法 同样 需要 大 量 计 算 ， 且 只 能 对 短 链 的 肽 进行 预测 。 
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综 上 所 述 ， 以 实验 方法 建立 模型 共同 的 缺点 是 太 过 耗 时 ， 且 常 受 限 于 
样本 的 制备 技术 。 因 此 ， 在 蛋白 质 尚未 以 实验 方式 取得 结构 前 ， 常 常 进行 
结构 模拟 。 目 前 较 理想 的 方法 是 分 析 蛋 白质 序列 ， 在 现存 蛋白 质 结构 数据 
库 中 取得 原子 三 维 坐标 ， 通 过 电脑 运算 构建 蛋白 质 的 结构 模型 ， 经 结构 最 
优化 ， 评 估 得 到 的 蛋白 质 结构 ， 最 后 取得 最 优 的 三 维 结构 模型 。 

常用 蛋白 质 分 析 相关 网 站 及 地 址 见 表 7. 1。 


表 7.1 常用 蛋白 质 分 析 相 关 网 站 及 链接 地 址 


名 Ж 链 接 地 址 
数据 库 
SRS http; //srs. ebi. ac. uk/ 
GenBank http: //www. ncbi nlm. nih. gov/Genbank/index. html 
SWISS-PROT http; //kr. expasy. org/sprot/ 
PDB http://www. resb. org/pdb/ 
SCOP http://scop. mrc-Imb. cam. ac. uk/scop/ 
CATH http: //www. biochem. ucl. ac. uk/bsm/cath_new/index. html 
DALI http; //www. ebi. ac. uk/dali/ 
模板 搜索 
BLAST http://www. ncbi. nlm. nih. gov/BLAST/ 
Fasta3 http://www. ebi. ac. uk/fasta3/ 
FUGUE http: //www-cryst. bioc. cam. ac. uk/~fugue/prfsearch. html 
二 级 结构 预测 
PHD http: //www. embl-heidelberg. de/predictprotein/predictprotein. html 
SOPMA http: //npsa-pbil. ibep. fr/cgi-bin/npsa_automat. pl? page= npsa_sopma. html 
nnPredict http://www. cmpharm. ucsf. edu/— nomi/nnpredict. html 
指认 (Threading) 
THREADER http; //insulin. brunel. ac. uk/threader/threader. html 
TOPITS http://www. embl-heidelberg. de/ predictprotein/submit_exp. html 
123D+ http: //www-lmmb. nciferf. gov/~nicka/123D. html 
FRSVR http://www. doe-mbi. ucla. edu/~frsvr/frsvr. html 
3D-PSSM http://www. bmm. icnet. uk/~3dpssm/ 
序列 比 对 
ClustalW http://www. ebi. ac. uk/clustalw/ 
BCM server http; //searchlauncher. bcm. tmc. edu/ 
同 源 模拟 
SWISS-MODEL http://www. expasy. org/swissmod/SWISS-MODEL. html 
MODELLER http; //guitar. rockefeller. edu/modeller/ 
WHATIF http: //www. cmbi. kun. nl/whatif/ 
Insightll/ QUANTA http: //www. msi. com/ 
模型 验证 
PROCHECK http://www. biochem. ucl. ac. uk/~roman/ procheck/ procheck. html 
BIOTECK http: //biotech. embl-heidelberg. de:8400/ 
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BER 


名 称 链接 地 n 
Prosa II http://www. came. sbg. ac. at/Services/prosa. html 
AQUA http://www. nmr. chem. uu. nl/users/jurgen/Aqua/server/ 
ERRAT http://www. doe-mbi. ucla. edu/Services/ERRAT/ 
SQUID http://www. ysbl. york. ac. uk/~oldfield/squid/ 
VERIFY3D http://www. doe-mbi. ucla. edu/Services/Verify_3D/ 
ERIR 
RasMol http://www. umass. edu/microbio/rasmol/ 
SWISS-PDBViewer http://www. expasy. org/spdbv/ 
Cn3D http://www. ncbi. nlm. nih. gov/Structure/CN3D/cn3d. shtml 


7.7 同 源 模拟 法 


同 源 模拟 是 蛋白 质 三 维 结构 预测 的 主要 手段 ， 也 是 目前 为 止 蛋 白质 结构 
预测 中 最 为 成 功 、 准 确 度 最 高 的 方法 。 但 同 源 模拟 有 一 个 前 提 条 件 ， 即 要 模 
拟 的 目标 蛋白 必须 有 一 个 或 多 个 已 知 结构 的 与 之 序列 高 度 相似 的 同 源 蛋 白 。 
通常 情况 下 ， 目 标 蛋 白 与 模拟 蛋白 的 序列 一 致 性 不 低 于 30% ， 如 果 二 者 能 
够 进行 联 配 的 区 域 长 度 超过 100 个 氨基 酸 残 基 ， 序 列 一 致 性 在 25% 以 上 ， 
也 可 以 进行 同 源 建 模 。 如 果 模 板 蛋白 与 目标 序列 的 序列 一 致 性 在 15% ~ 
25%， 即 所 谓 的 “交界 区 域 ”(twilight zone), ， 则 不 能 利用 简单 的 同 源 模拟 
来 预测 结构 。 

同 源 模拟 过 程 比较 复杂 ， 可 分 为 以 下 几 个 步骤 : 

O 寻找 一 个 或 一 组 与 待 测 蛋 白质 同 源 的 通过 实验 测定 的 蛋白 质 结构 ， 
进行 结构 至 和 ; 

© 建立 未 知 蛋白 质 与 已 知 结构 蛋白 质 的 序列 比 对 ; 

© 找 出 结构 保守 性 的 主 链 结构 片段 ; 

Ф 建 模 结构 变化 的 区 域 ， 一 般 为 环 区 ; 

© 侧 链 建 模 ; 

© 利用 能 量 计算 的 方法 进行 结构 优化 ; 

@ 评估 。 

目前 互联 网 上 提供 了 很 多 利用 同 源 模 拟 技 术 预 测 的 蛋白 质 结构 的 数据 
库 ， 比 如 SDSCIS (San Diego), 3D-JIGSAW (London), FAMS (Tokyo) 
和 SWISS-MODEL (Geneva) ， 其 中 Guex 等 人 发 展 的 SWISS-MODEL 是 使 
用 最 广泛 的 网 络 建 模 服务 器 。 

SWISS-MODEL (http: //swissmodel. expasy. org) 由 Manuel Peitseh 
于 1993 年 发 起 成 立 ， 在 Glaxo Smith Kline Geneva (GSK) 进一步 发 展 ， 通 
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过 ExPASy 服务 器 的 瑞士 生物 信息 中 心 (Swiss Institute of Bioinformatics, 
SIB ) 为 公众 提供 服务 。SWISS-MODEL 是 一 个 有 注解 的 基于 同 源 建 模 的 
蛋白 质 结构 服务 器 ， 它 与 专家 蛋白 质 分 析 系 统 ( Expert Protein Analysis 
System, ExPASy ) 网 站 是 紧密 联系 的 ， 其 中 有 的 也 来 自 于 DeepView 
(Swiss Pdb-Viewer ) 程序 。 此 服务 器 的 目的 是 向 全 世界 的 生物 化 学 和 分 子 
生物 学 工作 者 提供 蛋白 质 三 维 建 模 服务 。 它 开创 了 自动 建 模 的 先河 ， 是 迄今 
为 止 应 用 最 广泛 的 免费 在 线 服务 器 之 一 。 至 2008 年 9 Н, SWISS-MODEL 
数据 库 共 收录 数据 340 万 条 ， 覆 盖 了 UniProt 数据 库 中 270 万 种 不 同 的 蛋白 
质 序列 。SWISS-MODEL 数据 库 保持 定期 更 新 ， 保 证 了 收录 数据 的 全 面 性 
和 准确 性 。 

SWISS-MODEL 的 工作 模式 有 三 种 : 自动 模式 (Automated Mode), 
比 对 模式 (Alignment Mode) 及 项 目 模式 (Project Mode). 

a) 自动 模式 ”用户 可 直接 通过 web 界面 提交 氨基 酸 序列 或 Swiss- 
prot/TrEMBL 编号 〈accession) ， 服 务 器 会 全 自动 为 目标 序列 建立 模型 。 如 
果 一 条 模板 与 提交 的 目标 序列 相似 度 大 于 25% ， 建 模 程序 就 会 自动 开始 运 
行 。 但 是 ， 建 模 结果 的 可 靠 性 会 随 着 模板 与 目标 序列 之 间 相 似 度 的 降低 而 降 
低 ， 如 果 相 似 度 不 到 50% ， 往 往 就 需要 用 手工 来 调整 序列 比 对 。 这 种 模式 
只 能 进行 大 于 25 个 残 基 的 单 链 蛋 白质 三 维 结构 预测 。 

(2) 比 对 模式 ”用 户 可 以 通过 SWISS-MODEL 比 对 界面 上 传 FASTA, 
MSF、CLUSTALW、PFAM 或 SELEX 格式 的 多 重 序列 比 对 结果 。 当 然 ， 
此 序列 中 必须 至 少 包含 一 条 目标 序列 和 一 条 来 自 于 Expasy Protein Database 
(ExPdb) 的 模板 序列 。 

(3) 项 目 模 式 ” 用 户 可 将 经 过 手工 优化 的 请 求 提 交 给 服务 器 。 即 可 使 用 
DeepView 来 建立 一 个 项 目 文件 ， 它 包含 模板 结构 、 目 标 序列 和 模板 序列 的 
比 对 结果 。 


7.8 转录 因子 Оси 的 POUs 结构 域 同 源 模拟 


本 节 通 过 计算 机 模拟 的 方法 对 Oct4 的 POUs 结构 域 进行 模拟 预测 。 鉴 
于 Octl 的 POUs 结构 域 的 结构 已 在 1999 年 通过 X-ray 方法 获得 ，Oct4 的 
POU 结构 域 与 Оси 的 有 约 60% 相 似 ， 因 而 完全 可 以 采用 同 源 模拟 的 方法 
对 Oct4 的 POUs 结构 域 进 行 预测 。 在 此 我 们 采用 的 同 源 模拟 工具 是 
SWISS-MODEL 中 的 自动 模式 。 

【实验 步骤 】 

一 、 在 UniProt 数据 库 中 获取 Oct4 的 POUs 结构 域 的 序列 

1. 访问 UniProt (http: //www. uniprot. огр/) Ж 4 Ж #9 web 界面 
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图 7.7 UniProt 数据 库 的 初始 界面 


2. 在 “Query” 对 话 框 中 输入 Oct4， 点 击 “Search” 搜 索 该 蛋白 ， 数 秒 钟 
后 显示 搜索 结果 。 结 果 包 括 鼠 、 人 、 牛 、 免 等 不 同 种 属 的 特异 蛋白 〈 图 7. 8)。 
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图 7.8 Oct4 蛋白 在 UniProt 中 的 搜索 结果 


3. 选择 分 析 鼠 源 Oct4 蛋白 ， 点 击 该 蛋白 的 Accession (P20263)， 查 看 
其 信息 (图 7.9)。 

4. ЖЖ Оси 蛋白 的 POUs 结构 域 由 75 个 氨基 酸 组 成 ， 氨 基 酸 编号 为 
131-205。 点 击 这 一 段 氨基 酸 ， 获 取 其 序列 OR 7-10). 

二 、 利 用 SWISS-MODEL 中 的 自动 模式 进行 同 源 建 模 

Ф 访问 SWISS-MODEL (http: //swissmodel. expassy. org/) 服务 器 
的 web 界面 (8 7.11). 
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图 7. 10 POUs 结构 域 序列 
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图 7.11 SWISS-MODEL 服务 器 初始 界面 
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Q Æ "Modelling" —#F, АФ “AHA” (Automated Mode), # 
入 自动 建 模 模式 界面 (图 7. 12)。 在 “Email” 对 话 框 中 填写 自己 的 电子 邮 
Ж (电子 邮箱 可 以 填写 也 可 以 不 填写 ， 如 果 填 写 ， 提 交 任 务 完 成 后 ， 会 收 到 
邮件 提醒 ); 在 “Project title” 对 话 框 中 为 本 次 建 模 操作 填写 一 个 名 称 ， 如 
Oct4 POUs; # “Provide a protein sequence or a UniProt AC Code” 对 话 
框 中 输入 通过 步骤 一 获取 的 POUs 结构 域 的 序列 ; AH “Submit Modelling 
Request” 提 交 任 务 。 
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DMKALQKELEQFAKLLKOKRITLGYTQADVGLTLGVLFGKVFSQTTICRFEALQLSLKNMCKLRPLLEKWVEEAD 


[nic йч кезш] 


图 7.12 SWISS-MODEL 服务 器 自动 建 模 模式 界面 


O 提交 任务 大 约 几 分 钟 之 后 ， 邮 箱 会 收 到 建 模 任务 已 经 完成 的 邮件 。 
同时 SWISS-MODEL 服务 器 页 面 也 会 自动 更 新 ， 显 示 建 模 结果 (IR 7.13), 
结果 可 以 PDB 格式 查看 或 者 输出 。 


[myworkspace ] (коп 


Workunit: РО00007 Title:Oct-4 POUS 


Go to [Temglate Selecton] [Alignment] (Modeling Log] [Evaiatcn] 


Model Details: © 1 


display model: as 2 - as DoapViow project 
download model: as pdb - as Deecwewr proect- as ent 


图 7. 13 SWISS-MODEL 服务 器 的 建 模 结果 
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【实验 结果 】 

一 、 有 蛋白 P20263 的 序列 及 相关 信息 

(D 有 蛋白质 全 称 : 转录 因子 Octamer-binding protein 4 (Oct4) 。 

@ 基因 名 称 : Pou5fl。 

图 组 织 来 源 : DEKR. 

图 序列 长 度 : 352 个 氨基 酸 。 

© 存在 阶段 : 出 现在 转录 水 平 。 

© 蛋白 质 功 能 : 与 SOX2 及 DNA 结合 形成 三 元 复合 物 ， 调 控 胚胎 发 育 
早期 基因 的 表达 。 

@ X POUs 结构 域 长 度 : 75 个 氨基 酸 。 

Ө 其 POUs 结构 域 序列 : DMKALQKELEQFAKLLKQKRITLGYTQAD- 
VGLTLGVLFGKVFSQTTICRFEALQLSLKNMCKLRPLLEKWVEEAD, 


Alignment Ө pop) 

TARGET 7 KELEQF AKLLKQKAIT LOYTOADVOL TLGVLFGKVF SOTTICRPEA 
ioctc 5 di--eeleqf ektfkqrrik lgftqgdvgl amgklygndf sqttisrtes 
TARGET hhhhh hhhhhhhhhh  hhhhhh hhh Г 
loctc hhhhhh hhhhhhhhhh  hhhhhh hhh hhhhhhhh 
TARGET 52 — LOLSLKNMCK LAPLLEKWVE EAD 

loctc 529 lnlsfkreck lkpllekwln deerkkrtsi etnicvalei 

TARGET bhhhhh hhhhhhhhhh hh 

loctc hhhhhh hhhhhhhhhh hh hhhhhhhhh hhhh h 
TARGET - --- 

loctc 1298 eeitmisdql mmekevirw fonerqkeke inp 

TARGET 

lectc hhhhhhhhh н h 


FA 7.14 BLU Oct4 BEA POUs 结构 域 与 loctC 的 序列 比 对 


(a) 带 状 模型 


(b) 棍 状 模型 


图 7.15 ЖЯ Oct4 蛋白 POUs 结构 域 三 级 结构 
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=, РОО 结构 域 三 级 结构 建 模 


在 SWISS-MODEL 下 用 自动 模式 (automated mode) 进行 蛋白 质 三 级 结 


构 同 源 建 模 。 


找到 的 最 匹配 的 模板 为 : loctC (3. 00А). 
序列 的 匹配 度 为 69. 569%. 

评价 参数 : 2. 81e-20。 

目标 蛋白 与 模板 序列 比 对 如 图 7. 14。 
目标 蛋白 三 级 结构 模型 如 图 7. 15。 
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第 8 章 


ЕЕ (BB) 进化 工程 


蛋白 质 ( 酶 ) 进化 工程 就 是 应 用 分 子 生物 学 及 相关 技术 手段 ， 通 过 对 天 
然 蛋白 质 〈 酶 ) 的 体外 进化 改造 ， 获 得 性 能 更 适合 工业 需求 的 、 人 工 进 化 的 
非 天 然 蛋白 质 〈 酶 ) 。 酶 作为 具有 催化 功能 的 蛋白 质 ， 和 化 学 催化 剂 相 比 ， 
其 催化 反应 条 件 温 和 (常温 、 常 压 和 中 性 pH 等 )， 效 率 高 〈 化 学 催化 剂 的 
103 一 105 倍 ) ， 而 且 底 物 选 择 性 强 。 酶 制剂 已 应 用 到 食品 工业 、 医 药 业 、 环 
保 、 能 源 开发 和 生命 科学 等 各 个 方面 ， 随 着 节能 减 排 等 社会 经 济 发 展 的 强烈 
需求 ， 酶 应 用 领域 不 断 拓展 。 在 实际 工业 生产 条 件 下 (高 温 、 高 压 、 极 端 
pH， 以 及 存在 重金 属 离子 和 氧化 剂 等 蛋白 质变 性 剂 )， 天 然 酶 结构 和 功能 常 
常 遭 到 破坏 ， 从 而 使 酶 应 用 受到 极 大 限制 ， 发 展 酶 分 子 进化 的 理论 和 技术 成 
为 全 球 关 注 的 焦点 。 

早 在 1978 年 ， 加 拿 大 科学 家 Michael Smith 利用 蛋白 质 结构 信息 ， 
建立 了 定点 突变 技术 ， 不 仅 对 蛋白 质 中 特定 氨基 酸 的 作用 进行 了 探讨 ， 
而 且 也 在 体外 对 蛋白 质 功能 进行 了 进化 和 改造 。Michael Smith 因为 建立 
了 在 蛋白 质 结 构 分 析 基 础 上 的 定点 突变 技术 ， 于 1993 年 获得 了 诺 贝 尔 
奖 。 近 年 来 ， 随 着 酶 结构 -功能 关系 以 及 蛋白 质 分 子 进化 规律 了 解 的 深 
和 人 入， 科学 家 们 又 发 展 了 结构 基 序 嫁接 和 结构 域 重组 (domain swapping) 。 
前 者 代表 技术 如 北京 大 学 化 学 工程 学 院 来 鲁 华 教授 于 2000 年 报道 了 一 
种 蛋白 质 - 蛋 白质 相互 作用 表面 位 点 的 嫁接 方法 ， 取 得 了 不 错 的 成 果 。 
首先 确定 被 嫁接 的 配 体 表 面 结合 区 的 重要 残 基 ， 在 骨架 蛋白 中 搜索 适合 
于 嫁接 这 些 残 基 的 位 点 ， 基 于 对 映 残 基 的 Ce,CB8 原 子 坐标 ， 将 骨架 蛋白 
全 加 到 配 体 蛋 白 上 ， 评估 骨架 蛋白 与 受 体 蛋 白 的 互补 性 ， 并 留 下 互补 性 
较 好 的 骨架 蛋白 。 细 调 骨 架 蛋 白 与 受 体 蛋 白 的 相对 位 置 ， 使 之 具有 合理 
的 界面 堆积 密度 ， 然 后 在 骨架 蛋白 选 出 的 位 置 上 移植 配 体 蛋白 相应 的 残 
基 。 结 构 域 重组 指 募集 已 进化 的 蛋白 质 结构 模块 ， 根 据 所 需要 的 功能 进 
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行 重组 ， 因 此 突破 了 对 关键 残 基 突 变 仅 能 对 酶 部 分 性 质 改 变 的 局 限 性 ， 
在 较 大 范围 快速 实现 蛋白 质 功能 的 改造 。 但 由 于 目前 对 酶 分 子 结构 及 催 
化 机 理 研究 还 有 限 ， 使 用 理性 设计 方法 的 成 功率 还 不 高 ;同时 蛋白 质 功 
能 的 多 样 性 表明 ， 还 有 很 多 的 序列 和 结构 空间 没有 被 探测 到 ， 例 如 ， 
100 个 氨基 酸 构成 的 很 小 的 蛋白 质 ， 序 列 上 每 个 位 点 都 可 能 存在 20 种 
氨基 酸 的 任意 一 种 ， 最 后 所 有 可 能 的 组 合 是 201” ， 这 是 一 个 非常 庞大 
的 数目 ， 留 给 科学 家 对 蛋白 质 未 知 序 列 和 结构 的 探索 空间 。 

20 世纪 90 年 代 发 明了 蛋白 质 非 合理 设计 技术 -定向 进化 〈directed evo- 
lution) 技术 ， 定 向 进化 又 称 为 蛋白 质 的 体外 分 子 进 化 ， 是 蛋白 质 工 程 的 新 
策略 ， 是 在 试管 中 模拟 达尔 文 进化 的 过 程 ， 在 不 了 解 蛋白 质 结构 信息 的 情况 
下 ， 利 用 分 子 生 物 学 手段 对 蛋白 质 基因 的 序列 进行 突变 ， 创 造 分 子 的 多 样 
性 、 结 合 灵 敏 的 筛选 技术 ， 迅 速 得 到 理想 的 突变 体 。 定 向 进化 技术 应 用 自然 
进化 原理 来 发 展 非 理 性 的 蛋白 质 设计 技术 ， 将 更 有 可 能 获得 性 能 更 加 优良 或 
全 新 的 酶 ， 这 是 对 蛋白 质 理性 设计 的 完美 补充 。 美 国 加 州 理工 学 院 化 学 工程 
和 生物 化 学 教授 Arnold 女士 认为 :“ 定 向 进化 是 “ 物 竞 天 择 ” 的 一 个 高 级 版 
本 ， 是 在 分 子 水 平 上 的 进化 ， 研 究 的 对 象 不 是 整个 机 体 ， 而 是 特定 的 基因 或 
蛋白 质 .” 她 领导 的 研究 小 组 是 定向 进化 领域 的 权威 实验 室 ， 从 20 世纪 80 
年 代 末 就 开始 研究 定向 进化 ，1993 年 ，Arnold 应 用 分 子 进化 原理 创造 性 地 
利用 易 错 PCR (error-prone PCR，ep-PCR) 对 蛋白 质 进行 改造 ， 其 后 ， 又 
发 展 和 建立 了 一 系列 定向 进化 技术 和 方法 。 由 于 定向 技术 在 阑 明 蛋白 质 分 子 
进化 过 程 和 机 制 方面 的 贡献 ，Arnold 荣获 了 美国 三 院 院士 科学院、 工程 
院 和 医学 院 ) 称号 ， 成 为 八 个 健在 的 美国 三 院 院士 之 一 ， 也 是 唯一 的 女性 三 
院 院士 ， 并 成 为 世界 公认 的 定向 进化 、 生 物 催化 和 蛋白 质 工程 专家 。 她 主编 
了 蛋白质 定 向 进化 的 两 本 “圣经 ”一 一 定向 进化 建 库 方法 和 定向 进化 筛选 方 
法 。 随 后 ， 美 国 Affymax 研究 所 的 Stemmer 教授 于 1994 年 引入 DNA 改组 
技术 到 蛋白 质 的 定向 进化 过 程 中 ， 并 在 1997 年 以 分 子 育种 定向 进化 为 技术 
平台 建立 了 从 事 定向 进化 的 生物 制药 公司 Maxygen， 大 量 制 造 功 能 改进 的 
蛋白 药物 产品 。 

随 着 生命 科学 的 发 展 ， 十 几 年 来 ,定向 进化 技术 以 强大 的 生命 力 ， 
在 世界 各 地 实验 室 “ 生 根 发 芽 ， 开 花 结果 ”，F. Arnold 课题 组 1998 年 提 
出 的 交错 延伸 (stagger extension process, StEP) 和 体外 随机 引发 重组 
(random priming іп vitro recombination, RPR), RAY Ж JE XE JH эу X ^£ 4b 
学 系 S. Benkovic 教授 于 1999 年 建立 的 渐进 式 切 割 产 生 杂 合 酶 技术 CGn- 
cremental truncation for creation of hybrid enzymes，ITCHY) ，2001 年 美 
国 Enchira 生物 技术 公司 的 Coco 博士 发 明 的 过 渡 模板 随机 嵌 合 生长 重组 
技术 (random chimeragenesis on transient templates，RACHITT)， 以 及 
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德国 不 莱 梅 国际 大 学 Schwaneberg 课题 组 于 2004 年 提出 的 序列 饱和 突变 
技术 (sequence saturation mutagenesis, SeSaM) 等 方法 ， 蛋 白质 定向 进 
化 技术 不 断 走向 成 熟 ， 为 其 他 研究 者 提供 了 很 多 有 价值 的 经 验 和 可 借鉴 
的 方法 。 

尽管 理性 设计 和 定向 进化 在 蛋白 质 设计 及 功能 改造 方面 取得 了 巨 
大 成 功 ,但 两 者 却 各 有 优 劣 。 理 性 设计 在 分 子 内 引入 定点 突变 ， 对 关 
键 残 基 或 结构 元 素 进行 改变 ， 但 往往 受 限 于 蛋白 质 结 构 和 功能 间 关 系 
的 复杂 性 ， 并 且 目 前 对 酶 结构 解析 数量 还 有 限 ， 使 用 理性 设计 方法 的 
成 功率 还 不 高 ; 同时 蛋白 质 功 能 的 多 样 性 表明 ， 还 有 很 大 的 序列 和 结 
构 空 间 没 有 被 探测 到 。 而 定向 进化 虽然 能 够 克服 蛋白 质 结构 和 功能 关 
系 的 障碍 ， 而 且 常 常用 于 产生 有 利于 蛋白 质 折 生 和 功能 发 挥 的 一 些 精 
细 结 构 变 化 ， 但 是 需要 建立 一 个 针对 目标 性 质 的 高 通 量 筛选 方法 来 实 
现 ， 通 常 的 高 通 量 方法 都 会 消耗 大 量 的 人 力 和 物力 。 而 且 全 基因 范围 
的 随机 突变 ， 往 往 会 造成 人 力 、 物 力 的 浪费 ， 蛋 白质 序列 的 长 度 决定 
了 不 可 能 将 蛋白 质 序 列 上 所 有 的 突变 组 合 都 包含 在 内 ， 因 为 这 样 会 超 
过 绝 大 多 数 筛选 方法 的 承受 范围 。 

近年 来 ， 基 因 组 学 、 功 能 基因 组 学 、 结 构 生 物 学 、 生 物 信息 学 等 多 学 科 
迅猛 发 展 ， 酶 结构 -功能 知识 不 断 丰 富 ， 综 合 上 述 两 种 方法 所 发 展 起 来 的 半 
合理 设计 (semi-rational design) 结合 了 两 种 方法 的 优点 ， 以 蛋白 质 结构 为 
基础 ， 在 选 定 的 关键 功能 决定 区 域 来 进行 随机 突变 ， 建 立 小 型 、 智 能 型 突变 
库 ， 并 筛选 获得 许多 具有 优良 性 状 的 重要 突变 体 ， 有 利于 促进 快速 的 蛋白 质 
体外 进化 过 程 ， 极 大 地 缩短 了 自然 进化 进程 ， 从 而 发 展 和 丰富 蛋白 质 资源 ， 
这 是 蛋白 质 进 化 工程 技术 发 展 的 一 大 进步 。F. Arnold 研究 组 设计 了 
SCHEME 方法 ， 即 应 用 计算 生物 学 技术 对 不 同 母 体 酶 的 进行 结构 解析 ， 并 
在 保持 最 小 能 量变 化 的 基础 上 构建 嵌 合 酶 库 ， 筛 选 获得 了 稳定 性 提高 的 纤维 
素 酶 ;在 半 合理 设计 方法 的 探索 研究 中 ， 德 国 科学 家 也 作出 了 巨大 的 贡献 。 
德国 格 赖 夫 斯 瓦尔 德 大 学 Bornscheuer 教授 于 2008 年 提出 一 种 新 的 靶 向 定 
向 进化 方法 一 一 OSCARR 方法 (one-pot simple methodology for cassette 
randomization and recombination); 德国 马 普 学 会 煤化 所 所 长 Reetz 教授 提 
出 了 两 种 半 理 性 设计 方法 一 一 活性 位 点 组 合 饱和 突变 方法 (combinatorial 
active-site saturation test, CAST) 和 串联 饱和 突变 方法 (iterative satura- 
tion mutagenesis, ISM). 

蛋白 质 〈 酶 ) 进化 工程 技术 的 不 断 发 展 ， 使 人 们 对 蛋白 质 功能 设计 和 体 
外 进化 的 能 力 有 了 重要 提升 ， 经 过 不 断 实践 ， 获 得 了 多 种 适 于 医药 工业 、 化 
工 、 能 源 等 领域 应 用 的 生物 催化 剂 。 下 面 就 具体 介绍 各 种 蛋白 质 进 化 技术 所 
取得 的 重要 成 果 。 
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8.1 蛋白 质 的 理性 设计 


蛋白 质 理性 设计 是 基于 对 蛋白 质 结构 的 认识 ， 通 过 定点 突变 技术 改造 蛋 
白质 功能 的 一 种 方法 。 利 用 酶 理性 设计 获得 具有 理想 性 质 以 适用 于 工业 应 用 
的 突变 体 ， 关 键 是 确定 突变 靶 标 。 这 就 意味 着 在 突变 之 前 ， 人 们 需要 做 一 个 
经 过 仔细 考虑 的 猜测 ， 在 某 一 特定 位 点 进行 突变 ， 获 得 所 需 性 质 的 改变 ， 这 
个 方法 通常 要 求 有 一 个 已 经 解析 的 蛋白 质 晶体 。 当 然 如 果 可 以 ， 最 好 同时 获 
得 酶 与 底 物 类 似 物 或 抑制 剂 的 共 结 晶 产 物 ， 这 有 助 于 更 清晰 地 了 解 酶 和 底 物 
的 作用 界面 。 随 着 计算 生物 学 的 发 展 ， 即 使 没有 某 一 蛋白 质 解析 的 晶体 结 
构 ， 人 们 仍然 可 以 通过 计算 机 模拟 构建 结构 模型 ， 推 测 其 可 能 的 结构 ， 获 得 
其 可 能 的 结构 。 


8.1.1 蛋白 质 原 有 性 质 的 改进 


确定 影响 酶 性 质 的 关键 氨基 酸 以 及 催化 活性 分 歧 的 机 制 对 进行 酶 理性 设 
计 是 很 有 指导 意义 的 ， 而 确定 导致 酶 性 质 不 同 的 关键 残 基 就 是 对 酶 家 族 进行 
序列 和 结构 比 对 、 自 身 三 级 结构 和 酶 - 配 体 复合 物 的 分 析 。 此 外 ， 由 于 酶 的 
各 种 性 质 均 与 能 量变 化 相关 ， 而 计算 机 模拟 可 以 用 来 研究 酶 的 活性 中 心 、 底 
物 结合 、 和 柔性 和 人 解 折 倒 ， 所 以 分 子 对 接 以 及 分 子 动 力学 模拟 对 于 指导 突变 进 
行 理性 设计 是 很 有 意义 的 。 

Kazlauskas 对 以 往 酶 性 质 改 造 的 研究 进行 总 结 后 ， 指 出 在 多 数 情 况 下 
对 活性 中 心 较 近 的 残 基 进行 突变 优 于 对 远 距 离 残 基 的 突变 ， 具 体 表现 为 对 于 
立体 选择 性 、 底 物 特异 性 以 及 新 的 催化 活性 ， 近 距离 的 残 基 突 变 要 优 于 远 距 
离 残 基 突 变 ; 然而 近 距 离 和 远 距离 突变 均 能 改进 活力 、 热 稳定 性 以 及 对 有 机 
溶剂 的 稳定 性 。 这 也 说 明 近 距离 的 残 基 突 变更 有 可 能 得 到 酶 性 质 优越 的 突变 
体 ， 揭 示 理 性 设计 应 该 集中 在 对 近 距 离 的 残 基 进 行 突变 。 


8.1.1.1 底 物 特异 性 与 立体 选择 性 的 改造 

对 与 底 物 相关 性 质 进行 理性 改造 ， 是 建立 在 对 酶 和 底 物 相互 作用 理解 分 
析 的 基础 上 ， 与 底 物 结合 相关 的 关键 氨基 酸 即 组 成 底 物 进入 通道 ， 底 物 结合 
口袋 的 残 基 常 常 作为 突变 的 靶 标 。 

由 于 氨基 转移 酶 具有 广泛 的 底 物 谱 、 高 立体 选择 性 ， 以 及 不 需要 外 部 辅 
因子 再 生 的 特点 ， 因 此 是 很 有 前 景 的 、 能 用 于 酶 法 合成 光学 活性 胺 的 系统 。 
Ж Н Vibrio fluvialis 的 w- 氨 基 转 移 酶 (orATVf) 对 手 性 胺 具有 高 的 立体 选 
择 性 ， 以 及 对 芳香 族 胺 出 众 的 底 物 特异 性 ， 然 而 窄 的 底 物 特异 性 限制 了 其 在 
脂肪 族 胺 动力 学 拆 分 中 的 应 用 。Cho 等 使 用 同 源 模 建 和 底 物 -结构 -活性 关系 
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再 设计 的 底 物 特异 性 ， 组 成 底 物 结合 位 点 的 大 侧 链 残 基 W57 和 W147 可 能 
限制 o- AT VE 对 脂肪 族 胺 的 识别 ， 突 变 体 W57G 和 W147G 的 底 物 特异 性 发 
生 改 变 ， 即 在 不 影响 对 芳香 胺 水 解 活性 和 立体 选择 性 的 前 提 下 ， 可 以 催化 脂 
肪 族 胺 的 氨基 转移 。 

微生物 源 D- 乙 内 酰 脲酶 联合 N-carbamoylase 可 以 用 于 合成 光学 纯度 的 
рані 型 氨基 酸 ， 它 们 是 合成 半 合 成 性 抗生素 、 多 肽 激素 、 除 虫 菊 素 和 
杀 虫 剂 的 中 间 产 物 。 尽 管 来 源 于 Bacillus stearothermophilus 的 D-Z ABER 
酶 具有 很 多 优良 性 质 ， 但 是 其 偏好 于 非 取代 的 乙 内 酰 逐 ， 故 利用 结构 和 催化 
机 制 信息 确定 活性 中 心 处 loop 区 作为 突变 靶 标 ， 改 变 靶 标 氨 基 酸 的 侧 链 大 
小 和 朴 水 性 强 弱 ， 突 变 体 M631/F159S 对 底 物 对 羟基 莱 海 因 的 特异 性 提高 了 
200 倍 。 

特定 立体 构 型 的 羧 酸 酯 是 合成 药物 、 杀 虫 剂 和 天 然 化 合 物 的 重要 手 性 模 
块 ， 很 多 具有 立体 选择 性 的 脂肪 酶 仍然 不 能 用 于 要 求 高 纯度 的 药物 工业 应 
ЖН. 集中 突变 Yarrowia lipolytica 脂肪 酶 底 物 结合 位 点 处 的 五 个 残 基 
(T88, V94, D97, V232, V285), V232A 立体 选择 性 提高 10 倍 左右 ， 
V232L 的 立体 选择 性 发 生 反 转 。 以 Burkholderia cepacia 脂肪 酶 (BCL) К 
物 结合 口袋 的 三 个 残 基 (L17, V266 和 L287) 作为 突变 靶 标 ， 得 到 已 值 提 
高 10 倍 的 突变 体 L17M A E ff. (对 映 选择 性 参数 ) 增加 14 倍 同时 比 活 提 
高 15 倍 的 突变 体 L17S/L2871, 


8.1.1.2 催化 活力 的 改造 

与 底 物 立体 选择 性 相 比 ， 影 响 催 化 活性 的 分 子 因素 更 容易 预测 ， 通 过 对 
底 物 与 酶 活性 中 心 的 相互 作用 以 及 活性 中 心 结构 特点 进行 分 析 ， 可 以 找到 突 
破 口 。 

基于 计算 机 模拟 Cin silico〉 分 子 对 接 得 到 的 酶 - 底 物 复合 体 可 以 指导 确 
定 抑制 效果 或 活力 提高 的 突变 靶 标 。 利 用 in silico 分 子 对 接 分 析 谷 胱 甘 肽 转 
移 酶 (GST)， 将 与 外 源 物 〈 除 草 剂 和 杀 虫 剂 ) 结合 相关 的 两 个 残 基 
(1le218 和 Gln53) 作为 靶 标 ，Gln53Ala 对 杀 虫 剂 外 源 物 的 敏感 度 提 高 9. 2 
倍 。 磷 酸 三 酯 酶 (PTE) 能 够 有 效 水 解 一 系列 有 机 磷 COP) 杀 虫 剂 从 而 达 
到 解毒 效果 ， 故 PTE 可 以 作为 游离 酶 生物 治疗 而 商业 化 ， 并 在 动物 研究 中 
用 于 处 理 有 机 磷 中 毒 。 然 而 PTE 并 不 能 水 解 所 有 的 有 机 磷 ，Agrobacterium 
radiobacter 磷酸 三 酯 酶 的 底 物 对 接 显示 两 个 残 基 (F131 和 W132) 阻碍 底 
物 结合 ， 突 变 体 W131H/F132A 对 底 物 Z-CVP 和 E-CVP 的 水 解 活性 分 别 
提高 480 倍 和 8 倍 。 

为 了 增加 吡 喃 -2- 氧 化 酶 在 生物 燃料 细胞 和 食品 业 的 应 用 ， 对 其 活性 中 
心 残 基 进行 突变 ， 不 仅 得 到 了 活力 提高 的 突变 体 V546C 和 V546C/E542K， 
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也 得 到 热 稳定 性 和 活力 同时 提高 的 突变 体 L537G 和 L537W。 

WEM Claccase) 可 以 催化 氧化 一 系列 有 机 物 ， 典 型 的 就 是 酚 底 物 ， 删 除 
突变 也 是 理性 设计 的 一 个 重要 手段 ， 为 了 改进 漆 酶 ， 应 用 定点 突变 和 删除 突 
变 对 其 进行 改造 ， 得 到 酶 活力 和 热 稳定 性 均 提高 的 突变 体 。 

此 外 ， 理 性 设计 也 可 以 降低 酶 的 副 反 应 ， 嗜 热 糖苷 酶 突变 体 N282T 
不 仅 具 有 高 的 转 糖 背 活性 ， 且 对 供 体 邻 硝 基 葵 基 ВОЗЕ FLEE (NPGa) Ж 
现 出 与 转 糖 活 性 竞争 和 产生 副 反应 的 自 缩合 活性 ， 对 亚 位 点 [十 1] / [+2] 
进行 理性 设计 ， 以 降低 对 oNPGal 的 结合 力 ， 结 果 A221W/N282T 虽 仍 具有 
自 缩合 活性 ， 但 与 N282T 相 比 降低 很 多 ， 而 其 转 糖 活性 却 几乎 不 变 。 


8.1.1.3 稳定 性 改造 

酶 能 否 广泛 应 用 于 工业 ， 也 受热 稳定 性 、 有 机 稳定 性 以 及 pH 耐 受 性 等 
性 质 的 影响 。 

最 近 证 明 利 用 计算 机 方法 对 蛋白 质 表面 电荷 -电荷 之 间 相互 作用 能 量 的 
优化 来 理性 设计 提高 热 稳定 性 ， 同 时 保持 活力 不 受 损失 ， 通 过 对 不 同 大 小 和 
结构 的 两 个 酶 酰基 础 酸 酶 AcPh 和 Cdc42 GTPase 进行 改造 ， 得 到 的 突变 体 
稳定 性 均 优 于 野生 型 。 同 样 基于 计算 模型 理性 设计 Thermotoga maritima Ж 
聚 糖 酶 B 的 pH， 与 预期 一 致 ， 对 五 个 残 基 的 取代 (E70Q,，E74Q,， E77Q, 
G85Q 和 T87Q) 改变 了 最 适 pH， 最 适 pH 从 5. 1 变 为 5. 5， 活 性 pH 范围 
也 向 碱 性 移动 0. 5 个 单位 。 

在 体内 ，L- 阿 拉 伯 糖 异 构 酶 转化 L- 阿 拉 伯 糖 为 САВ Е, 在 体外 ， 也 
作为 D- 塔 格 糖 异 构 酶 将 D- 半 乳糖 异 构 化 为 塔 格 糖 ， 高 温和 碱 性 pH 下 的 异 
构 化 将 引发 副 反 应 ， 而 大 部 分 L- 阿 拉 伯 糖 异 构 酶 的 最 适 pH 处 于 碱 性 区 ， 
为 了 提高 塔 格 糖 的 产 率 ， 对 阿拉 伯 糖 异 构 酶 进行 理性 设计 ，Q268K 的 耐酸 
能 力 更 强 ， 在 酸性 条 件 下 的 活力 也 增加 ; N175H 在 较 低温 度 50 — 65°C 范围 
内 具有 最 高 的 活性 ， 双 点 突变 体 Q268K/N175H 综合 了 前 二 者 的 优点 。 


8.1.2 有 蛋白质 优良 性 质 的 组 合 


将 具有 不 同 优越 性 质 的 同一 家 族 酶 进行 结构 域 嫁 接 可 能 获得 综合 性 质 优 
越 的 突变 体 ， 从 而 满足 工业 应 用 的 需求 。 基 于 (B/s HERIK loop 嫁接 的 研 
究 揭 示 ， 在 同一 家 族 中 进行 结构 元 件 嫁接 获得 性 质 改进 的 突变 体 是 可 行 的 。 

脂肪 酸 酰胺 水 解 酶 (FAAH) 能 水 解 大 麻 素 和 酰胺 化 的 信号 脂 质 ， 遗 
传 学 和 药理 学 灭 活 的 FAAH 可 以 止痛 ， 抗 焦虑 和 消炎 ， 表 明 FAAH 将 成 为 
非常 有 前 景 的 治疗 靶 标 。 然 而 受到 人 源 FAAH 表达 的 限制 ， 利 用 分 子 生 物 
学 技术 将 人 和 鼠 源 FAAH 的 活性 中 心 互 换 ， 得 到 的 人 / 鼠 FAAH ЖАЖА 
有 人 FAAH 的 敏感 性 和 鼠 РААН 的 高 表达 量 。 
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BUR [e] Jt E EY) [Б] UR B PA ^E A ЯК1Ч ЖЕЛЕ BO — 77 
ik. Kamondi 使 用 来 自 Thermotoga maritima 的 两 个 纤维 素 酶 : thermophi- 
lic xylanase A catalytic domain (TmxAcat, Topt=68'C) 和 hyperthermo- 
philic xylanase B (TmxB, Top = 102°C) 通过 理性 的 家 族 重组 (rational 
family shuffling) 构建 了 21 MRA, Ж 4 个 嵌 合 体 的 最 适 温 度 比 Tmx- 
Acat 的 高 ， 其 中 最 稳定 的 嵌 合 体 (Top = 80°C ) 两 个 末端 片段 均 来 自 
TmxB。 进 一 步 分 析 表 明 ，N 和 C 末端 片段 之 间 的 相互 作用 对 整体 热 稳 定性 
贡献 很 大 ; 这 对 那些 N 末端 和 С 末端 相互 联系 的 酶 进行 再 设计 具有 一 定 的 
指导 意义 。 

大 部 分 脂肪 酶 具有 一 个 盖子 Cd) 结构 域 来 调节 活性 中 心 是 否 暴露 ， 
但 是 Bacillus subtilis 脂肪 酶 A (LipA) 的 活性 中 心 却 直接 暴露 于 溶剂 中 ， 
为 了 提高 LipA 对 1,2-O-isopropylidene-sn-glycerol (IPG) 酯 的 动力 学 拆 分 ， 
用 Fusarium solani 角质 酶 和 Penicillium purpurogenum 乙酰 木 聚 糖 酯 酶 较 
K loop 取代 LipA 活性 位 点 人口 处 的 loop， 产 生 的 杂 合 体 对 理想 的 IPG 对 
映 体 表现 了 相反 的 立体 选择 性 。 


8.1.3 蛋白质 新 催化 活性 的 获得 


在 自然 界 进化 中 得 到 的 新 酶 相 较 于 已 有 酶 来 说 仅仅 发 生 了 微小 的 改变 ， 
这 说 明 在 现 有 酶 基本 骨架 上 只 需要 进行 loop 区 域 的 插入 、 删 除 、 替 换 或 者 
氨基 酸 的 取代 ， 即 可 获得 新 酶 活性 ， 因 此 来 自序 列 和 结构 方面 的 信息 将 指导 
活性 转换 。 

由 于 苯 甲 酸 酯 水 解 酶 在 工业 和 医药 业 应 用 具有 很 大 的 潜力 ，H6st 期 望 
Д ЛУКА ИЕА (human carbonic anhydrase) 工具 有 对 对 硝 基 葵 酚 苯 甲酸 酯 
的 水 解 活性 ， 基 于 一 个 过 渡 态 类 似 物 和 人 碳酸 栈 酶 开 活 性 中 心 的 分 子 对 接 分 
析 ， 成 功 构 建 了 具有 苯 甲 酸 酯 水 解 活性 的 三 点 突变 体 V121A/V143A/ 
T200A， 它 不 仅 对 莱 甲 酸 酯 具有 水 解 活性 [kca/ Km = 625 ( E 38) L/Cmol • 
s)]， 而 且 对 其 他 酯 底 物 也 有 很 高 的 水 解 活性 [对 硝 基 苯酚 乙酸 酯 的 eat / Km = 
101700( 士 4800)L/Cmol。s)]， 从 而 由 碳酸 栈 酶 获得 了 具有 水 解 活性 的 酯 酶 。 

Kazlauskas 和 Bornscheuer 两 课题 组 期 望 将 假 单 胞 荧光 杆菌 酯 酶 
(PFE) 转化 为 环 氧 化 物 水 解 酶 ， 通 过 对 二 者 催化 机 制 以 及 氨基 酸 序列 的 比 
较 ， 确 定 了 包括 活性 中 心 Ser 在 内 的 8 个 残 基 可 能 导致 活性 歧化 ， 然 而 ， 构 
建 的 7 个 突变 体 都 未 表现 出 环 氧化 物 水 解 酶 活性 。 在 分 析 了 两 种 水 解 酶 的 结 
构 后 发 现 一 段 loop 区 对 二 者 的 功能 差异 可 能 起 重要 作用 ， 将 其 嫁接 最 终 成 
功 获得 具有 环 氧化 物 水 解 酶 活性 的 突变 体 。 这 表明 对 基本 骨架 进行 微调 是 可 
以 获得 新 酶 活性 的 ， 前 提 是 不 仅 要 了 解 催化 机 制 和 进行 序列 比 对 ， 更 重要 的 
是 对 靶 标 酶 的 三 级 结构 进行 分 析 。 
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对 酶 基本 骨架 微调 可 获得 新 活性 ， 而 上 面 的 实例 显示 微调 处 也 需要 构象 
优化 ， 以 便 功能 残 基 的 侧 链 精 确定 位 ， 从 而 可 以 和 新 底 物 相互 作用 。 基 于 这 
一 理论 ，David Baker 课题 组 发 明了 一 种 计算 机 方法 对 活性 中 心 附 近 loop 区 
重建 和 再 设计 ， 以 引入 特异 性 的 酶 - 底 物 相互 作用 ， 从 而 获得 新 酶 活性 。 对 
ASEAK loop 区 进行 优化 再 设计 ， 以 产生 关键 的 相互 作用 与 
底 物 ammelide， 设 计 的 突变 酶 对 ammelide 的 活力 提高 100 fit. 

与 非 金属 酶 相 比 而 言 ， 金 属 酶 的 理性 设计 更 加 富有 挑战 性 ， 这 不 仅仅 表 
现在 金属 结合 位 点 多 变 和 不 同 的 金属 离子 氧化 状态 ， 而 且 计算 机 模拟 时 的 力 
场 也 不 确定 。 但 是 研究 者 仍然 通过 在 肌 红 蛋白 远 端 口袋 引入 3 个 His 和 1 个 
Glu， 成 功 地 设计 出 了 一 个 金属 蛋白 的 结构 和 功能 模型 一 一 一 氧化 氮 还 原 
R$ NOR, 

尽管 合理 设计 已 取得 一 定 的 成 功 ， 但 是 对 很 多 蛋白 质 工程 研究 者 来 讲 ， 
这 个 方法 仍然 充满 意外 和 艰辛 ， 对 蛋白 质 结构 上 的 认 知 一 旦 出 现 偏差 ， 就 不 
会 获得 功能 上 的 理想 改变 ， 而 且 就 算是 在 对 蛋白 质 结构 和 功能 关系 有 着 正确 
理解 下 的 设计 ， 也 很 难 获得 性 质 显著 改善 的 突变 体 ， 而 定向 进化 的 出 现 很 好 
地 改变 了 这 一 状况 。 


8.2 蛋白质 的 定向 进化 


定向 进化 属于 蛋白 质 的 非 理 性 设计 ， 它 不 用 事先 了 解 蛋白 质 的 结构 、 保 
守 位 点 、 催 化 机 制 等 因素 ， 而 是 人 为 地 创造 特殊 的 进化 条 件 ， 模 拟 自然 进化 
机 制 ， 在 体外 对 酶 基因 进行 改造 ， 并 定向 筛选 ， 获 得 具有 某 些 预期 特征 的 进 
化 酶 。 酶 定向 进化 技术 在 一 定 程度 上 弥补 了 定点 突变 技术 的 不 足 ， 具 有 很 大 
的 应 用 价值 。 


8.2.1 定向 进化 的 原理 及 目的 


定向 进化 是 利用 Taq DNA 聚合 酶 不 具有 3' 一 5 校对 功能 的 性 质 ， 并 结 
合 基因 工程 现 有 技术 手段 ， 在 待 进化 酶 基因 的 PCR 扩 增 反应 中 ， 配 合适 当 
条 件 ， 以 很 低 的 比率 向 目的 基因 中 随机 引入 突变 ， 并 构建 突变 库 ， 凭 借 定向 
的 选择 方法 ， 选 出 所 需 性 质 优化 的 酶 。 

定向 进化 的 基本 规则 是 :“ 获 取 所 所 需 性 质 的 突变 体 ”。 简 言 之 ， 定 向 进 
化 就 是 随机 突变 同 筛选 或 选择 相 结合 。 与 自然 进化 不 同 ， 定 向 进化 是 人 为 引 
发 的 ， 制 造 某 一 方向 的 进化 而 排除 其 他 方向 突变 的 作用 ， 整 个 进化 过 程 完全 
是 在 人 的 控制 下 ， 所 以 ， 定 向 进化 又 被 称 为 “试管 内 进化 ”。 酶 分 子 定向 进 
化 的 目的 在 于 人 为 地 改变 天 然 生物 催化 剂 的 某 些 性 质 ， 增 强 稳定 性 ， 创 造 天 
然 生物 催化 剂 所 不 具备 的 某 些 优良 特性 ， 甚 至 创造 出 新 的 活性 和 产生 新 的 催 


132 于 白质 结构 模拟 与 设计 


化 能 力 ， 扩 大 生物 催化 剂 的 应 用 范围 。 
8.2.2 定向 进化 的 应 用 


定向 进化 在 其 出 现 的 短 短 十 几 年 内 已 发 展 成 一 门 相当 成 熟 的 蛋白 质 及 多 
肽 的 改造 技术 ， 它 的 应 用 极 大 地 促进 了 酶 工程 、 代 谢 工程 以 及 医药 等 其 他 相 
关 领 域 的 发 展 。 在 众多 研究 者 的 共同 努力 下 ， 蛋 白质 定向 进化 领域 取得 了 显 
著 成 绩 ， 定 向 进化 应 用 于 工业 生物 催化 剂 改造 的 成 功 例子 已 经 很 多 。 

COD 提高 酶 分 子 的 催化 活力 “ 葵 甲 酰 甲 酸 脱羧 酶 的 副 反 应 是 催化 碳 碳 键 
形成 的 聚 醛 作用 ， 来 源 于 Pseudomonas putida HPR P RKR, 
定向 进化 获得 了 突变 体 L476N， 该 突变 体 相对 于 野生 型 来 讲 其 聚 醛 酶 活力 
提高 5 倍 ， 而 且 作者 认为 其 Leu476 位 氨基 酸 为 通过 控制 产物 释放 活性 中 心 
的 “门户 守卫 者 ”。 三 磷酸 酯 酶 通过 基于 随机 突变 的 定向 进化 结合 微 珠 法 簿 
选 ， 获 得 63 倍 于 野生 型 活力 提高 的 突变 体 。 利 用 DNA 改组 方法 ，Stemmer 
对 有 内 酰胺 酶 进行 了 改造 ， 以 向 培养 物 中 添加 头孢 氨 哮 为 选择 压力 ， 经 三 轮 
DNA 改组 和 筛选 ， 得 到 了 酶 活力 提高 32000 倍 的 突变 体 。 

(2) 提高 酶 分 子 的 稳定 性 ”Zhao Н. 等 利用 连续 的 易 错 PCR 获得 数 株 
阳性 克隆 ， 并 用 交错 延伸 方法 重组 DNA， 采 用 连续 提高 培养 温度 对 突变 体 
进行 筛选 ， 最 终 获得 一 株 突变 体 ， 不 仅 将 枯草 杆菌 蛋白 酶 的 最 适 温度 提高 了 
17'C ， 还 使 酶 在 65CC 的 半衰期 增加 了 200 倍 。 定 向 进化 也 用 于 探查 酶 分 子 
在 进化 过 程 中 的 热 稳定 性 和 酶 活力 之 间 的 关系 ，Giver L. 等 利用 枯草 杆菌 
来 源 的 对 硝 基 苯酚 酯 酶 来 研究 进化 过 程 中 的 热 稳定 变化 ， 他 们 通过 连续 4 轮 
随机 突变 和 1 HE DNA 改组 ， 获 得 了 突变 酶 ，Tn 增加 了 14°C. Te 30C 时 同 
时 对 酶 活力 和 热 稳定 性 进行 筛选 ， 获 得 了 热 稳定 性 提高 ， 同 时 维持 原 酶 活力 
的 突变 酶 分 子 。Komeda 对 来 源 于 Ochrobactrum anthropi SV3 的 D 型 氨基 
酸 酰 胺 酶 的 稳定 性 和 活力 进行 了 随机 突变 和 筛选 。 突 变 克 隆 菌 株 在 平板 上 原 
位 裂解 热处理 ， 同 时 显 色 分 析 ， 获 得 一 个 最 适 反应 温度 提高 5C B. vmx 提 高 
3 倍 的 突变 体 。 

(3) 提高 酶 分 子 的 底 物 专 一 性 ”Zhang 等 在 定向 进化 实验 中 证 明 ， 对 底 
物 特异 性 影响 的 突变 氨基 酸 不 仅仅 局 限于 底 物 的 结合 位 点 。 他 们 利用 定向 进 
化 把 一 个 半 乳 糖苷 酶 改造 成 以 果糖 为 底 物 的 酶 ， 虽 然 kt 下降 2 倍 , 但 Km 
FRET 20 倍 。 突 变 体 的 序列 分 析 表 明 ， 利 用 7 轮 进化 筛选 出 的 6 个 突变 体 
中 仅 有 3 个 位 于 底 物 结合 位 点 附近 ， 另 外 3 个 并 不 在 底 物 结合 口袋 或 酶 活性 
位 点 附近 。Alexeeva 等 对 来 源 于 Aspergillus niger 具有 茶 胺 氧化 作用 的 酶 
进化 其 对 a- 甲 基 芋 胺 作用 能 力 ， 应 用 致 错 菌 株 Е. coli XL-1 red， 通 过 平板 
显 色 法 在 含有 - 甲 基 苯胺 底 物 的 平板 上 进行 筛选 ， 得 到 进化 菌株 Asn336Ser 
的 对 于 a- 甲 基 莱 胺 活力 提高 50 倍 的 突变 体 。May 等 对 来 源 于 Arthrobacter 
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sp. DSM 的 D- 海 因 酶 进行 了 定向 进化 ， 使 其 对 于 L-5- 乙 内 酰 脲 的 选择 性 增 
强 ， 通 过 随机 突变 结合 饱和 突变 的 方法 应 用 平板 pH 指示 剂 法 得 到 具有 所 需 
性 质 的 突变 体 。Reetz 和 Jaeger 等 通过 几 轮 的 随机 突变 结合 DNA shuflling， 
对 于 脂肪 酶 的 立体 选择 性 进行 了 改进 ， 经 过 45000 个 菌株 的 筛选 获得 了 一 个 
突变 体 ， 其 对 于 R 型 底 物 的 EE 值 由 1.1 提高 到 30。Williams 对 催化 立体 化 
学 的 碳 氮 键 形成 的 1,6- 二 磷酸 塔 格 糖 醛 醇 酶 的 立体 选择 性 采用 ОМА shu- 
flling 进行 了 定向 进化 ， 进 化 后 的 突变 体 的 催化 效率 较 野 生 型 对 非 天 然 底 物 
1,6- 二 磷酸 塔 格 糖 提高 了 80 倍 。 

随 着 体外 基因 多 样 性 设计 策略 、 高 通 量 筛选 技术 的 发 展 ， 以 及 应 用 范围 
的 拓展 ， 相 信 在 不 久 的 将 来 ， 人 们 能 发 现 并 创造 出 大 量 理想 的 蛋白 质 ， 提 高 
其 在 实际 应 用 中 的 使 用 价值 。 


8.3 蛋白 质 的 半 合 理 设计 


虽然 理性 设计 和 定向 进化 在 蛋白 质 设 计 上 取得 了 巨大 成 功 ， 但 是 两 者 作 
为 蛋白 质 改造 方法 却 各 有 优 劣 。 理 性 设计 一 般 用 来 在 分 子 内 引入 随机 突变 不 
易 获 得 的 关键 性 的 残 基 或 结构 元 素 ， 而 定向 进化 常用 来 产生 有 利于 蛋白 质 折 
登 和 功能 发 挥 的 一 些 精细 结构 变化 。 因 此 ， 两 者 的 结合 将 大 大 扩展 蛋白 质 工 
程 学 的 研究 范围 ， 制 得 具有 许多 优良 性 状 的 蛋白 质 ， 大 大 缩短 自然 进化 的 进 
程 ， 从 而 极 大 地 发 展 和 丰富 蛋白 质 资源 ， 应 当 说 这 是 蛋白 质 工程 技术 发 展 的 
一 大 进步 。 

此 外 ， 理 性 设计 往往 受 限于 蛋白 质 结构 和 功能 间 关 系 的 复杂 性 ， 定 向 进 
化 虽然 能 够 克服 蛋白 质 结构 和 功能 关系 的 障碍 ， 但 是 需要 建立 一 个 针对 目标 
性 质 的 高 通 量 筛 选 方法 ， 通 常 的 高 通 量 方法 都 会 消耗 大 量 的 人 力 和 物力 。 而 
且 全 基因 范围 的 随机 突变 ， 往 往 会 造成 人 力 、 物 力 的 浪费 ， 因 为 控制 某 一 所 
需 性 质 的 位 点 ， 有 可 能 仅仅 局 限于 序列 的 某 一 部 分 。 不 仅 如 此 ， 蛋 白质 序列 
的 长 度 决 定 了 不 可 能 将 蛋白 质 序列 上 所 有 的 突变 组 合 都 包含 在 内 ， 因 为 这 样 
会 超过 绝 大 多 数 的 筛选 方法 的 承受 范围 。 因 此 如 果 能 够 将 两 种 方法 结合 ， 即 
半 合 理 设计 (semi-rational design)， 应 用 随机 突变 探测 改变 所 需 性 质 的 关 
键 位 点 ， 随 后 理性 选 定 一 些 位 点 进行 饱和 突变 ， 可 提高 对 目标 酶 所 需 性 质 的 
改造 效率 。 


8.3.1 基于 结构 的 有 选择 的 随机 突变 


一 旦 解析 获得 蛋白 质 的 晶体 结构 ， 尤 其 是 与 底 物 类 似 物 共 结晶 的 结构 ， 
可 以 清楚 地 获得 酶 和 底 物 的 作用 关系 。 但 是 仍然 存在 的 问题 是 ， 作 用 位 点 可 
能 是 个 很 广泛 的 区 域 ， 并 且 对 此 区 域 随机 突变 的 互相 组 合 结果 仍然 是 个 只 有 
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筛选 能 够 解决 的 问题 。 对 确定 区 域 的 随机 突变 ， 确 实 可 以 提高 进化 的 效率 ， 
毕竟 这 相对 于 整个 蛋白 质 序列 来 讲 还 是 一 个 相对 小 并 且 更 重要 的 范围 。 

Santoro 等 应 用 这 种 针对 目标 序列 的 随机 突变 ,来 改变 Сге- РМА 重组 
酶 的 底 物 特异 性 ， 应 用 此 酶 与 底 物 共 结晶 结构 的 信息 ， 选 择 了 两 个 有 可 能 的 
短 序列 范围 ， 分 别 包含 5 个 和 6 个 残 基 ， 建 立 随机 突变 库 ， 获 得 一 株 原 本 野 
生 型 不 具备 的 对 新 的 底 物 序列 识别 的 突变 体 ， 该 方法 可 以 很 有 效 地 进化 到 所 
需 的 性 质 。 类 似 地 ，Rui 等 对 一 种 环 氧化 物 水 解 酶 的 降解 特性 进行 改造 ， 也 
是 采用 选 定 的 位 点 进行 饱和 突变 ， 经 过 仔细 的 结构 研究 ， 最 终 在 较 小 的 库 中 
挑选 到 一 个 活力 提高 10 倍 的 突变 体 。 


8.3.2 随机 突变 后 的 定点 饱和 突变 


当 结构 信息 不 足以 支持 一 个 成 功 的 合理 设计 时 ， 可 以 采用 随机 突变 作为 
先导 ， 用 来 探测 对 所 需 性 质 的 有 益 突 变 位 点 ， 再 针对 确定 的 有 效 位 点 施 以 饱 
和 突变 ， 可 以 很 快速 地 提高 所 需 的 目标 性 质 。Reetz 等 采用 随机 突变 结合 筛 
选 ， 对 来 源 于 Pseudomonas aeruginosa 的 酶 对 底 物 的 立体 选择 性 进行 改造 ， 
四 轮 的 随机 突变 使 其 正 值 由 1.1 上 升 为 11.3， 随 后 对 随机 突变 中 确定 的 
“热点 ”(155 位 和 162 位 氨基 酸 ) 进行 了 饱和 突变 ， 获 得 了 EE 值 达到 55 的 
更 优 突变 体 。Geddie 等 对 大 肠 杆菌 的 葡萄 糖苷 酸 酶 的 底 物 特异 性 进行 半 
合理 设计 ， 针 对 几 轮 定向 进化 中 获得 “热点 ”的 定点 饱和 突变 ， 使 其 及 樱 草 
糖苷 酶 的 活力 再 次 提高 近 70 倍 ， 随 后 将 优势 突变 体 基因 进行 重组 ， 使 得 催 
化 活力 提高 至 100 倍 。 


8.3.3 ”随机 突变 与 定点 饱和 突变 同步 


基于 蛋白 质 结构 的 比 对 和 序列 比较 ，Peimbert 等 在 Streptococcus pneu- 
monia 转 肽 酶 中 引入 及 内 酰胺 酶 活力 ， 同 步 地 采用 全 序列 随机 突变 和 选 定位 
点 的 定点 饱和 突变 。 获 得 了 一 个 具备 较 高 内 酰胺 酶 活力 的 突变 体 。 这 个 方 
法 被 证 明 有 效 地 利用 了 已 知 的 结构 信息 ， 同 时 采用 随机 突变 探测 未 知 的 有 效 
位 点 ， 同 样 可 以 获得 所 需 性 质 的 快速 提高 。 


8.3.4 计算 机 辅助 的 半 合 理 设 计 


通常 的 半 合理 设计 可 以 很 好 地 限定 随机 突变 范围 ， 使 得 随机 突变 更 有 目 
的 性 ， 但 是 尽管 如 此 ， 选 定 可 能 范围 后 ， 最 后 的 随机 突变 的 库容 量 ， 仍 然 是 
很 大 的 。 事 实 上 ， 对 5 个 残 基 的 20 种 氨基 酸 的 随机 突变 ， 最 后 的 库容 是 
205 一 3.2X10*。 对 通 量 不 是 很 高 的 筛选 方法 ， 这 个 数量 仍然 庞大 。 借 助 计 
算 机 的 帮助 ， 采 用 模拟 的 方法 ， 现 在 已 经 能 够 剔除 不 必要 的 突变 ， 保 证 在 尽 
可 能 小 的 库 中 ， 产 生 更 多 的 有 益 突变 。 
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Hayes 等 用 一 种 称 为 蛋白 质 设计 自动 化 (protein design automation, 
PDA) 的 计算 机 算法 ,来 预测 能 够 形成 正常 蛋白 质 折 伙 的 突变 体 ， 最 后 结 
果 证 明 ， 这 个 方法 剔除 有 害 突变 后 ， 需 要 筛选 的 库容 量 下 降 了 几 个 数量 级 。 
TEM-1 8 内 酰胺 酶 的 19 个 预先 确定 的 残 基 随机 突变 库 (7X 107). 进行 计算 
机 模拟 筛选 ， 选 定 其 中 200000 个 能 量 最 低 结构 的 突变 体 构建 突变 库 ， 在 这 
个 比 原来 小 得 多 的 突变 库 中 获得 了 1280 倍 于 野生 型 活力 的 突变 体 。 

总 的 说 来 ， 半 合理 设计 综合 了 合理 设计 和 非 合理 设计 两 个 方法 的 优点 。 
针对 自身 实验 材料 的 特点 ， 灵 活 地 将 两 种 方法 互相 补充 ， 可 以 提高 对 所 需 性 
质 进行 改良 的 速度 。 随 着 计算 机 模拟 的 生物 信息 学 的 不 断 发 展 ， 引 入 更 加 依 
赖 于 高 性 能 、 高 精度 、 低 成 本 的 模拟 计算 可 以 为 酶 性 质 的 改造 提供 更 强 的 畏 
助 。 通 过 半 合 理 设计 ， 在 对 酶 的 改造 上 ， 人 们 可 以 采用 更 多 更 灵活 的 方法 ， 
制备 出 更 优 品质 的 酶 ， 同 时 进一步 加 深 对 酶 的 结构 和 功能 关系 的 理解 。 


8. 4 ”应 用 实例 一 一 超 嗜 热 酰基 肽 水 解 酶 / 酯 酶 的 半 理性 设计 


8.4.1 引言 


在 冯 雁 教授 实验 室 的 前 期 工作 中 ， 我 们 已 克隆 表达 了 来 源 于 超 嗜 热 古 细 
菌 Aeropyrum pernix K1 的 酰基 肽 水 解 酶 基因 APE1547， 酶 学 性 质 分 析 表 
明 ， 所 获得 的 重组 蛋白 apAPH 主要 表现 出 酰基 肽 水 解 酶 和 酯 酶 的 双 活 性 。 
对 其 晶体 结构 进行 解析 发 现 ， 该 酶 属于 丝氨酸 蛋白 酶 家 族 中 新 发 现 的 睛 氨 酸 
ЖЇК (POP) 亚 家 族 ， 由 一 个 a/B 水 解 酶 结构 域 和 一 个 B 推进 器 结构 域 组 
成 ， 酶 活性 中 心 位 于 两 个 结构 域 之 间 。 在 获得 酶 结构 信息 的 基础 上 ， 我 们 期 
望 能 阐明 apAPH 具有 催化 双 功 能 性 的 结构 基础 ， 并 通过 定向 进化 获得 酯 酶 
活性 提高 的 突变 库 。 本 节 先 通过 序列 及 结构 比 对 确定 可 能 对 酶 底 物 特异 性 具 
有 重要 作用 的 Arg526 位 点 ， 对 其 建立 定点 饱和 突变 体 ， 并 通过 高 通 量 筛选 
获得 酯 酶 活力 明显 提高 、 肽 酶 活力 明显 下 降 的 突变 体 ， 使 apAPH 由 双 功 能 
酶 变 为 具有 良好 底 物 专 一 性 的 酯 酶 。 在 此 基础 上 ， 我 们 选择 了 具有 代表 性 的 
突变 体 ， 对 其 进行 了 稳 态 动力 学 测定 及 分 子 动力 学 模拟 ， 证 明了 526 位 点 决 
定 底 物 选择 性 的 重要 作用 ， 并 揭示 了 丝氨酸 蛋白 酶 家 族 与 脂肪 酶 家 族 的 进化 
相关 性 。 


8.4.2 实验 方法 


8.4.2.1 同 源 序列 比 对 
分 别 选取 来 源 于 Aeropyrum pernix Kl. Caenorhabditis elegans, RAF 
(rat liver)， 人 红细胞 (human erythrocytes), Bacillus subtilis, Fugu ru- 
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bribes fj Bk dk 4X Bt Jk BE; 来 源 于 Pyrococcus horikoshii, Ж ЇЙ (porcine 
brain) ， 牛 脑 (bovine brain), Arabidopsis thaliana Ё SKERXERKRE; FEV 
于 Archaeoglobus fulgidus, Bacillus acidocaldariu, Alicyclobacillus aci- 
docaldarius , Escherichia coli, Moraxella 的 激素 敏感 酯 酶 (hormone sensi- 
tive lipase, HSL) 的 序列 中 对 应 apAPH 的 Arg526 位 点 附近 的 五 肽 氨基 酸 
序列 进行 同 源 比较 。 


8.4.2.2 蛋白 质 三 级 结构 比 对 
采用 混合 延伸 (combinatorial extension, CE) 方法 搜索 蛋白 质 结 构 相 
似 性 ， 其 算法 是 将 蛋白 质 的 结构 元 件 作 为 可 比 对 的 结构 片段 Caligned frag- 
ment pairs) ， 使 用 类 似 于 序列 同 源 性 的 算法 得 到 结构 相似 程度 高 的 蛋白 质 。 
CE 算法 更 多 地 基于 片段 相似 性 ， 而 不 是 整体 的 拓扑 结构 。 对 搜索 到 的 结构 
进行 RMSD (Root Mean Square Deviation) 分 析 以 定量 其 整体 结构 相似 性 。 
RMSD 的 计算 公式 如 下 : 


Ха 


RMSD- ,| —— 
n 


RP, n 为 原子 数 ;， di 为 相应 的 i 原子 间 的 距离 。 

结构 相似 的 判定 标准 为 : 相同 的 结构 Cidentical structure), Ж RMSD= 
0, 相似 的 结构 (similar structures), J& RMSD—1-—3À; 进化 关系 较 远 的 
结构 (distant structures), 其 RMSD>3A, 


8.4.2.8 全 质粒 PCR 构建 定点 饱和 突变 库 
应 用 简易 全 质粒 PCR 突变 法 (QuickChange® site-directed mutagenesis 
protocol) 建立 Arg526 位 点 的 饱和 突变 库 ， 引 物 设 计 如 下 : 
R526N _ f: 5'-ATGAACGACAGC NNKACACCGCTGAGCATCGACCG-3' 
R526N _ r: 5 -СССТССАТССТСАССССТСТ MNNGCTCGTCTTCAT -3' 
使 用 全 质粒 PCR. 反应 构建 饱和 突变 库 ，PCR 体系 为 : 


野生 型 pET 15b-apAPH dNTP 0. 2 mmol/L 
质粒 模板 DNA 50ng DNA polymerase 5U 
上 游 引物 40 pmol 10X Reaction buffer 5 pL 
下 游 引物 40 pmol ddH;O 补充 至 100 pL 


PCR 反应 条 件 : 94C ，lmin; 45°C, 1тіп; 72°C, 10min, 20 个 循 
Ж; 72C，20min。 反 应 结束 后 加 入 2U DpnI 37°C Rik 1h， 消 化 野生 型 
基因 的 质粒 模板 ， 利 用 PCR 纯化 试剂 盒 对 PCR 产物 进行 纯化 ， 以 除去 
盐 离 子 及 蛋白 质 ， 取 2pL 电 转 化 入 大 肠 杆菌 BL21 (DE3) CodonPlus 感 
受 态 细胞 。 
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8.4.2.4 饱和 突变 库 的 筛选 
使 用 实验 室 前 期 建立 的 针对 嗜 热 酯 酶 的 高 通 量 筛选 方法 ， 对 apAPH 的 
饱和 突变 库 进行 了 筛选 ， 具 体操 作 如 图 8. 1 所 示 。 
"Bf BLP(DE3) 感受 态 细胞 
挑 单 菌落 入 96 孔 平板 (200pL 含 50mg/mL ampicllin 2YT) 
37°C 180r/min 振荡 过 夜 培养 
取 10pL 转 入 新 板 对 应 孔 ( 原 板 保存 ) 
加 入 IPTG(1mg/mL)37'C180r/min 振荡 5h 诱导 表达 
3000r/min 离心 弃 上 清 
БИЖ 3 次 破碎 菌 体 ,加 入 20001. 50mmol/L 磷酸 缓冲 液 (pH8. 0) 
80°C 水 浴 30min 除 杂 蛋白 
3000r/min 离心 上 清 即 为 粗 酶 液 


201. 转 入 含有 200pL 50mmol/L 磷酸 缓冲 液 (0. 2mmol/L pNPC8) 新 板 ， 
80°C 保温 30min, 酶 标 仪 测定 ODwos 


图 8.1 饱和 突变 库 的 筛选 流程 


8.4.2.5 野生 型 apAPH 及 其 突变 体 的 表达 及 粗 酶 获得 

选择 pET15b 作为 质粒 表达 载体 ，E. coli BL21 (DE3) CondonPlus {Е 
为 宿主 细胞 进行 apAPH 及 其 突变 体 的 高 效 表达 。 

将 野生 型 apAPH 与 其 突变 体 的 工程 菌 按 2% 接 种 量 接种 于 5mL 含有 
50pg/mL 氨 共 青霉素 的 2X YT 培养 基 中 ， 在 37'C 下 振荡 培养 过 夜 。 按 同样 
接种 量 接种 于 200mL 2x YT 培养 基 ，37 信 振荡 培养 3 一 4h， 然 后 接种 于 2L 
2XYT 培养 基 中 ，37 仿 振荡 培养 ， 当 培养 液 的 600nm 吸光 度 值 达到 0. 6 一 
1.0 时 ,加 入 诱导 剂 IPTG 至 终 浓 度 为 lmmol/L, 25°CH PUK. TE 6000r/ 
min 下 离心 20min， 收 集 菌 体 ， 一 20C 冷 冻 保 存 。 

在 室温 下 融化 菌 体 , 加 入 5 ~ 10 倍 体积 的 50mmol/L 磷酸 缓冲 液 
(pH8.0)， 超 声波 破碎 细胞 lOmin, 细胞 破碎 液 于 85C 水 浴 保 温 半 小 时 失 活 
大 部 分 杂 蛋 白 ，12000r/min 离心 20min 后 收集 上 清 ， 即 得 粗 酶 液 。 


8.4.2.6 野生 型 apAPH 及 其 突变 体 的 镍 亲 和 柱 纯化 

3mL 镍 亲 和 柱 (Ni-chelating.column) 加 入 去 离子 水 至 柱 顶 端 ， 自 然 洗 
脱 后 用 5 倍 体积 的 х Charge buffer 自然 洗 脱 ， 再 加 入 去 离子 水 至 柱 顶 端 自 
然 洗 脱 ， 后 用 3 倍 柱 体积 1X Binding buffer 自然 流 干 ， 再 将 0. 22um 滤 膜 过 
滤 的 粗 酶 液 上 柱 ， 待 自然 流 干 后 用 10 倍 柱 体积 的 Binding buffer 自然 洗 脱 。 
最 后 用 6 倍 柱 体积 的 1 X Wash buffer 洗 脱 目的 蛋白 质 ， 然 后 用 20mmol/L 
磷酸 缓冲 液 (pH8. 0) 透析 蛋白 质 溶液 除去 咪唑 ， 用 聚 乙 二 醇 包 埋 浓 缩 目 的 
蛋白 ， 电 泳 检 测 纯度 。 
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8.4.2.7 酯 酶 、 肽 酶 活力 测定 

以 对 硝 基 葵 酚 辛 酸 酯 (pNP-C8) 作为 酯 酶 底 物 ， 缓 冲 体系 为 50mmol/L 
磷酸 缓冲 液 (pH8. 0) ， 底 物 终 浓 度 为 0. 2mmol/L， 反 应 体系 为 ImL， 酶 适 
d. 在 80C 用 2550 紫外 可 见 分 光 光 度 计 测定 405nm 的 吸光 度 值 的 变化 曲 
线 。1 个 酶 活力 单位 定义 为 1 分 钟 水 解 底 物 生成 lumo ЕНЕ 0 e= 
0. 016LVkmol) 所 需要 的 酶 量 。 酶 活 计 算 公 式 如 下 : 
ЛОРУ 
Ув cs 

式 中 ，AOD4os 为 反应 时 间 内 405пт 的 吸光 度 变化 值 ; V 为 反应 体系 体 
积 (mL); e 为 对 硝 基 苯酚 的 消光 系数 (0.016L/umol); c 代表 反应 时 间 ， 
min; Vg 是 加 入 的 酶 量 ，mL; cg CARA, mg/mL. 

肽 酶 活力 的 测定 以 对 硝 基 苯胺 乙酰 亮 氨 酸 (Ac-Leu-pNA) 为 底 物 ， 对 
硝 基 葵 酚 的 消光 系数 为 〈0. 016LVpmol) 。 其 余 方 法 、 数 据 处 理 手 段 等 与 酯 
酶 活力 测定 相同 。 


8.4.2.8 动力 学 常数 测定 

在 50mmol/L 磷酸 缓冲 液 (pH 8.0), 80°C Aff F WE Ef ^E WY apAPH 
及 其 突变 体 的 活力 ， 使 用 pNPC8 和 AcLeu-pNA 作为 底 物 测定 其 酯 酶 、 
肽 酶 活性 ， 选 定 的 浓度 范围 分 别 在 20 一 200kmolL 和 200 一 2000kmol/L 
之 间 。 测 定 酶 反应 初速 度 并 应 用 Lineweaver-Burk 作 图 法 对 1/V-1/[S] 作 
图 ， 由 在 两 轴 上 的 截 距 求 得 Km fü Cr 轴 截 距 的 负 倒 数 ) УУ Су 轴 截 
距 的 倒数 ), 再 由 Vmax = EX [E] 计算 出 kc， 从 而 得 到 动力 学 常数 Km 和 
ken fE o 


8.4.2.9 野生 型 apAPH 及 突变 体 底 物 复合 物 模 型 构建 

所 有 的 计算 由 Insight I 2000 kitm (Accelrys, San Diego, CA), 使 
用 BIOPOLYMER 模块 用 于 小 分 子 底 物 的 构建 ， 能 量 最 小 化 和 分 子 动力 学 
模拟 应 用 DISCOVER 模块 在 连续 共 价 力 场 下 完成 。 使 用 apAPH 1. 8A 晶体 
结构 (PDB id: 1VE6 ) 作为 计算 初始 蛋白 质 模 版 。 氢 原子 按照 PH 8.0 时 
残 基 的 解 离 状 态 添 加 到 蛋白 质 分 子 中 ， 原 子 电 势 按照 连续 共 价 立场 力 场 内 加 
入 ， 在 酶 分 子 表面 加 添 5A 水 分 子 层 。 

小 分 子 AcLeu-pNA 与 蛋白 质 的 复合 物 结构 采用 手动 对 接 方式 生成 ， 
底 物 的 亮 氨 酸 侧 链 摆 放 在 肽 底 物 51 结合 位 点 ， 同 时 保证 其 酰基 氧 位 于 
Arg526 残 基 肛 基 集团 的 附近 ， 之 后 进行 能 量 最 小 化 ， 获 得 构象 为 后 续 突 变 
体 模 型 构建 的 初始 模板 。 分 子 对 接 模板 交 由 PROCHECK 程序 绘制 拉 氏 构 
象 图 ， 检 测 其 结构 合理 性 。 

使 用 高 级 分 子 对 接 程序 Affinity 对 小 分 子 pNPC8 进行 自动 分 子 对 接 ， 


酶 活 (U/mg) = 
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应 用 模拟 退火 和 蒙特 卡 洛 法 ， 对 apAPH 和 底 物 对 接 的 最 佳 构象 按照 能 量 标 
准 进行 优化 选择 ， 最 终 选取 能 量 较 低 且 小 分 子 位 置 摆 放 有 利于 反应 进行 的 构 
象 ， 将 对 接 结果 交 由 PROCHECK 程序 绘制 拉 氏 构象 图 ， 检 测 其 结构 合 
理性 。 

在 野生 型 apAPH 与 底 物 复合 物 的 基础 上 ， 使 用 BIOPOLYMER 对 
Arg526 位 残 基 进 行 取代 ， 构 建 突变 体 的 模型 。 保 持 蔡 换 残 基 侧 链 的 方向 与 
Arg526 方向 一 致 ， 并 进行 能 量 最 小 化 ， 利 用 PROCHECK 程序 绘制 拉 氏 构 
象 图 ， 检 测 其 结构 合理 性 。 


8. 4.2. 10 分 子 动力 学 模拟 

分 子 动力 学 模拟 “MDS) 计算 由 Insight П 2000 软件 完成 。 在 前 期 
构建 的 酶 分 子 与 底 物 结合 的 复合 结构 中 ， 固 定 以 活性 中 心 Ser445 为 中 
心 15A 范围 外 的 残 基 ， 其 余 氨基 酸 与 水 分 子 的 作用 包括 在 计算 之 内 。 设 
定 非 共 价 作用 距离 为 20A， 在 分 子 动力 学 模拟 之 前 先 使 用 陡 降 法 进行 
100 步 能 量 最 小 化 ， 之 后 应 用 梯度 退火 方法 进行 能 量 最 小 化 ， 能 量 梯度 
收敛 至 0. 001 keal/(mol+ A)。 能 量 收敛 体系 在 经 过 100fs 的 预 平衡 后 ， 
在 310K 进行 100ps 的 动力 学 模拟 ， 以 lfs 为 一 步 ， 共 收集 101 个 构象 ， 
对 每 个 构象 中 关键 残 基 与 底 物 的 相对 位 置 、 相 互 作用 进行 仔细 分 析 ， 解 
释 酶 动力 学 所 获得 的 结果 。 


8.4.3 实验 结果 


8.4.3.1 半 理 性 设计 思路 的 确立 及 突变 位 点 选择 

衡量 蛋白 质 的 进化 关系 最 常用 的 方法 是 同 源 序列 比 对 。 然 而 ， 对 于 
经 历 了 长 期 趋 异 进化 的 蛋白 质 家 族 来 说 ， 利 用 三 级 结构 重合 比较 
(structure alignment) 来 确定 蛋白 质 进 化 关系 的 方法 可 以 提供 很 多 序列 
同 源 性 无 法 提供 的 信息 。 我 们 利用 CE 算法 ， 对 apAPH 进行 了 结构 相似 
性 搜索 ， 发 现 apAPH 的 催化 结构 域 与 激素 敏感 脂肪 酶 CHSL) SORA 
有 惊人 的 相似 性 (图 8. 2)， 来 自 嗜 热 古 菌 Archaeoglobus fulgidus К) B 
酶 AFEST 的 主 链 C 原子 RMSD 仅 为 2. 3A。 一 般 来 源 于 共同 祖先 的 蛋 
白质 ， 在 序列 同 源 性 低 于 25% 时 ， 两 者 的 主 链 重 合 偏差 值 仍然 可 能 接近 
2A, 而 apAPH 与 AFEST 的 序列 同 源 性 仅 为 18%， 但 是 两 者 的 主 链 重 
合 偏差 仅 为 2. 3 信 ， 并 且 在 底 物 选择 上 两 者 都 偏 嗜 选择 酰基 链 长 度 为 8 
个 碳 原子 左右 的 酯 ， 这 种 结构 和 功能 上 的 相似 性 表明 两 者 在 进化 上 密切 
相关 ， 有 可 能 来 源 于 同一 祖先 。 

对 apAPH 的 基本 酶 学 性 质 和 其 序列 进行 分 析 ， 我 们 发 现 apAPH ЖА 
有 许多 酯 酶 、 脂 肪 酶 家 族 的 特征 。 比 如 其 催化 三 联 体 的 排列 顺序 (Ser445… 
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图 8.2 ЖА РОР 家 族 apAPH (青色 ) 和 来 自 HSL 家 族 的 
AFEST (RE) 催化 结构 域 和 催化 三 联 体 的 结构 重合 〈 见 彩 图 ) 


Asp524…His556) 与 脂肪 酶 、 酯 酶 (Ser144… Asp203… His257) 相同 ， 却 
与 经 典 的 丝氨酸 蛋白 酶 家 族 成 员 胰 凝 乳 蛋 白 酶 〈His57…Asp102…Ser195)、 
枯草 杆菌 蛋白 酶 (Asp32… His64…Ser221) Ж [8]; 在 其 催化 活性 中 心 Ser 
附近 具有 脂肪 酶 家 族 的 典型 基 序 CGly-X-Ser-X-Gly); 更 为 重要 的 是 ， 
apAPH 表现 了 较 高 的 酯 酶 活性 ， 其 绝对 催化 活力 比 其 “天 然 活 性 ”酰基 上 肽 
水 解 酶 活力 还 要 高 8 倍 左右 。 这 些 现象 显示 ，apAPH 与 脂肪 酶 / 酯 酶 超 家 族 
之 间 具 有 结构 、 功 能 上 的 联系 ,以 天 然 的 apAPH 作为 进化 起 点 ， 通 过 蛋白 
质 工程 的 手段 提高 其 酯 酶 活力 ， 也 许 是 获得 具有 良好 性 质 的 新 型 酯 酶 的 一 条 
风 新 思路 。 对 突变 体 的 性 质 进行 全 面 的 分 析 ， 不 仅 可 以 帮助 理解 apAPH 双 
重 酶 活力 的 结构 基础 ， 还 有 可 能 为 阐明 酯 酶 、 脂 肪 酶 家 族 与 丝氨酸 蛋白 酶 家 
族 在 分 子 进化 中 的 联系 提供 新 的 启示 。 

我 们 对 HSL 家 族 与 POP 家 族 活性 中 心 的 残 基 组 成 进行 了 详细 比较 ， 发 
现 临 近 催化 三 联 体 Asp524 的 526 位 点 在 两 个 家 族 中 均 高 度 保 守 ， 但 氨基 酸 
性 质 却 表现 出 明显 的 差异 CR 8. 1) Е POP 家 族 中 ， 该 位 点 为 带电 的 精 氨 
酸 ; 但 在 HSL 家 族 中 主要 为 疏水 残 基 。Arg526 位 点 在 POP 家 族 中 的 作用 
很 早 就 受到 人 们 的 关注 ， 来 源 于 猪 脑 的 POP 晶体 结构 显示 ，Arg526 参与 了 
与 寡 肽 底 物 的 结合 ， 构 成 了 酶 与 底 物 作 用 的 S2 位 点 (图 8. 3)。 在 脂肪 酶 家 
族 中 ， 该 位 点 的 作用 尚 没有 详细 的 研究 ， 但 这 个 氨基 酸 位 于 酶 与 底 物 酰基 结 
合 的 通道 中 ， 也 可 能 对 底 物 的 结合 具有 重要 作用 。 由 于 酰基 肽 水 解 酶 
apAPH 与 酯 酶 AFEST 的 催化 结构 域 极为 相似 ， 而 在 活性 中 心 的 526 位 点 
上 却 存在 极 性 的 明显 差异 ， 促 使 我 们 推测 526 位 点 可 能 对 酶 的 底 物 特异 性 有 
重要 的 影响 。 因 此 ， 我 们 选 定 apAPH 的 526 位 点 进行 饱和 突变 ， 探 讨 其 对 
于 酶 催化 和 底 物 选择 性 的 作用 。 
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表 8.1 乙酰 氨基 乙酰 肽 酶 (APH), MARSH (РОР) 和 激素 敏感 脂肪 酶 
CHSL) Arg526 位 附近 的 序列 比 对 


RESO 
каже 524 525 526 527 528 
Aeropyrum pernir Kl Asp Ser Arg Thr Phe 
Caenorhabditis elegans Asp Leu Arg Val Val 
rat liver Asp Ala Arg Val Phe 
АЕН human erythrocytes Asp Arg Arg Val Phe 
Bacillus subtilis Asp Asp Arg Cys Phe 
Fugu rubribes Asp Lys Arg Val Phe 
Pyrococcus horikoshii Asp Asp Arg Val His 
рар porcine Asp Asp Arg Val Val 
Thermobi fida fusca Asp Thr Arg Val Asp 
Gloeobacter violaceus Asp Pro Arg Val Asp 
Archaeoglobus fulgidus Asp Phe Leu Arg Asp 
brefeldin A Asp Phe Leu Arg Asp 
Alicyclobacillus acidocaldarius Asp Phe Leu Arg Asp 
HE. Human Asp Phe Met Leu Asp 
Escherichia coli Asp Phe Leu Leu Asp 
Moraxella ТА144 Asp lle Leu Arg Asp 

L 


Ф 对 应 于 Aeropyrum perniz КІ 乙酰 氨基 乙酰 肽 酶 的 残 基 号 . 


Asn555 


Argó43 


Z-Pro-prolinal 


gi 


图 8.3 POP 酶 的 活性 中 心 Arg643 (在 apAPH W 
中 对 应 Arg526) 与 肽 底 物 形成 一 对 氢 键 


8.4.3.2 Arg526 饱和 突变 库 的 建立 及 筛选 
利用 带 有 简 并 密码 子 的 引物 ， 通 过 全 质粒 PCR 一 次 将 20 种 可 能 的 天 然 
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氨基 酸 全 部 引入 野生 型 pETISb-apAPH ÆA, Xt Arg526 位 点 进行 饱和 突 
变 。 将 PCR 产物 经 过 Dpn 工 酶 切 消 化 后 转化 进入 大 肠 杆菌 BL21 (DE3) 中 
构建 了 Arg526 的 饱和 突变 库 。 接 下 来 利用 实验 室 中 已 经 建立 好 的 、 针 对 嗜 
热 酯 酶 的 高 通 量 筛选 方法 ， 对 饱和 突变 库 的 酯 酶 、 肽 酶 活力 进行 筛选 。 为 保 
证 编码 20 种 氨基 酸 的 32 种 密码 子 在 库 中 被 筛选 到 的 概率 大 于 99%, RN 
挑选 了 大 约 300 个 克隆 用 来 筛选 。 结 果 发 现 饱 和 突变 库 中 的 突变 体 对 两 种 底 
物 表现 出 完全 不 同 的 性 质 (图 8. 4) 。 大 多 数 突变 体 的 酯 酶 活力 都 获得 了 提 
高 ， 其 中 约 有 一 半 的 突变 体 活力 比 野生 型 apAPH 提高 2 倍 以 上 , Z9 12% 的 
突变 体 活力 表现 为 野生 型 活力 的 5 倍 以 上 。 酯 酶 活力 提高 最 明显 的 突变 体 活 
力 约 为 野生 型 的 7 倍 。 令 人 吃惊 的 是 ， 绝 大 多 数 突变 体 对 肽 酶 底 物 Ac-Leu- 
DNA 的 活力 都 下 降 了 ， 仅 有 约 20% 的 突变 体 表现 为 野生 型 apAPH 50% LA 
上 的 活力 。 


突变 体 与 野生 型 在 
405nm 处 吸光 度 比 值 


图 8.4 apAPH 人 饱和 突变 库 酯 酶 和 肽 酶 活力 的 筛选 


对 活性 变化 最 明显 的 突变 体 进行 测序 ， 发 现 肽 酶 活力 最 低 的 突变 体 为 
R526E， 而 酯 酶 活力 最 高 的 突变 体 由 R526I、R526L、R526V 等 突变 组 成 ， 
证 明了 526 位 点 在 催化 两 种 底 物 时 起 到 了 不 同 的 作用 。 对 526 位 点 的 任何 突 
变 都 会 降低 apAPH 的 肽 酶 活力 ， 说 明 经 过 自然 选择 的 优化 ，Arg 已 经 是 该 
位 点 的 最 佳 选择 。 而 酯 酶 活力 表现 出 了 对 朴 水 残 基 很 强 的 偏好 性 ， 说 明 在 
526 位 点 疏水 残 基 比 Arg 更 适合 水 解 酯 酶 底 物 。 


8.4.3.3 突变 体 的 纯化 与 性 质 鉴定 

为 了 详细 研究 526 位 点 不 同 侧 链 对 催化 的 影响 ， 进 一 步 构建 了 比 
Arg 侧 链 短 的 R526K 和 完全 去 掉 其 侧 链 的 R526A 两 个 突变 体 。 为 了 进 
一 步 确定 突变 体 活力 变化 的 详细 情况 ， 对 阳性 突变 体 进 行 了 高 效 表达 及 
蛋白 质 纯化 ， 经 过 镍 柱 亲 和 色谱 和 分 子 得 两 步 纯 化 ， 野 生 型 和 突变 体 
apAPH 的 纯度 都 达到 了 95% 以 上 (图 8.5、 图 8.60. ， 可 以 进行 下 一 步 
的 酶 学 性 质 表征 。 
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图 8.5 apAPH 纯化 突变 体 的 SDS-PAGE 分 析 
1 一 分 子 量 标准 ，2 一 突变 体 R5261; 3 一 突变 体 R526V; 4 一 突变 体 R526L 


图 8.6 apAPH 纯化 的 野生 型 和 突变 体 的 SDS-PAGE 分 析 
1 一 突变 体 R526A; 2 一 突变 体 R526E; 3 一 突变 体 R526K; 
4 一 分 子 量 标准 ; 5 一 野生 型 apAPH; 6 一 突变 体 R526V 


动力 学 测定 表明 ， 作 为 与 野生 型 侧 链 差别 最 大 的 突变 体 ，R526E 导致 水 
解 肽 酶 底 物 Ac-Leu-pNA 时 催化 效率 下 降 了 2 个 数量 级 OR 8.2)。 同 时 ， 
526 位 点 朴 水 的 突变 I, L, V 对 酯 酶 底 物 的 催化 效率 分 别 上 升 了 3.4 fi. 
4.9 倍 和 5.6 倍 。R526A 与 R526K 虽然 侧 链 不 同 ， 但 对 两 种 底 物 的 催化 效 
率 差别 却 不 明显 。 

总 体 说 来 ，526 位 点 的 突变 对 于 不 同 底 物 产生 了 不 同 的 影响 ， 在 水 解 
肽 酶 底 物 时 突变 体 的 Ku 都 有 明显 的 上 升 ; 水 解 酯 酶 底 物 时 ， 尽 管 R526E 
的 Km 也 出 现 了 明显 的 增高 ， 但 催化 效率 的 变化 主要 是 由 kat 的 增高 引起 
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的 ， 进 一 步 说 明了 526 位 点 在 催化 两 种 不 同类 的 底 物 时 发 挥 了 不 同 的 作 
用 。 对 于 肽 酶 底 物 来 说 ，Ku 增高 幅度 最 大 的 是 带电 荷 的 突变 R526K 和 
R526E， 而 朴 水 侧 链 的 突变 R526A、R526I、R526L 和 R526V 则 变化 较 
小 ， 并 且 长 侧 链 的 I[、L、V 的 Km 比 短 侧 链 的 A 要 低 2 倍 左右 。 而 在 水 解 
酯 酶 底 物 时 ， 朴 水 并 且 侧 链 较 长 的 突变 R526I、R526L 和 R526V 的 А. E 
升 最 为 明显 ， 清 楚 地 显示 了 在 水 解 酯 酶 底 物 时 526 位 点 对 朴 水 侧 链 的 偏 
嗜 性 。 


表 8.2 apAPH 野生 型 及 其 突变 体 的 动力 学 常数 


肽 酶 (Ac-Leu-pNA) 酯 酶 (pNPC8) 


酶 eat Kn kn/ Km Dm Ka kom/ Km 
/s™! | /(mmol/L) | 9] — /s /Gmol/L) | /LL/(nmol + s)] 
WT 9.30.5 0.40. 0 22. 3+3. 8 6.60.4 43. 3 士 2.8 152. 4 士 17. 1 
R526A 12. 6 士 0.4| 4.30.3 2.9+0.1 9.6+0.2 41.6+2.6 230.7+7.1 
К526Е 0.50.0 5.80.6 0.10.0 8.10.4 114. 67.7 70.79. 0 


9.40.6 38. 2+2. 8 246. 131. 5 
20.81. 5 40.13. 6 518. 73:5. 25 
28.5+1.1 38. 2+2. 9 746. 1498.5 
30. 9+0. 9 35.7+1.6 865. 5+ 14.6 


R526K 26. 9 士 1.3| 10.5+1.2 
R5261 9.20.5 2.10.1 
1.30.0 
1.70. 0 


2.60.3 
4.40.6 
7.4 士 0.8 
5.7 士 0.6 


由 于 526 位 点 的 突变 同时 造成 酯 酶 活力 的 上 升 和 肽 酶 活力 的 下 降 ， 所 以 
突变 体 对 于 两 种 底 物 的 选择 性 发 生 了 极 大 的 变化 (图 8.7)。 以 野生 型 
apAPH 水 解 两 种 底 物 活力 的 比值 为 1， 突变 体 这 个 比值 均 大 幅度 提高 。 其 
中 变化 最 大 的 R526E 对 酯 酶 底 物 的 选择 性 为 野生 型 的 129 倍 , ИК 
链 的 R526A, R5261, R526L 和 R526V 分 别提 高 了 11.85 倍 、17. 38 fif. 
11.88 flf, 22.83 倍 ， 显 示 了 526 位 点 对 于 底 物 识别 的 重要 作用 。 同 时 测定 
了 突变 体 对 不 同 碳 链 长 度 的 酯 酶 底 物 的 选择 性 ， 与 野生 型 相 比 并 没有 变化 
(图 8. 8) ， 说 明 526 位 点 仅 决定 肽 酯 两 类 底 物 的 选择 性 ， 而 不 能 影响 对 酯 酶 
底 物 大 小 的 选择 性 。 


B 82 
О 肽 酶 活力 


相对 活力 


6 
5 
4 
3 
2 
1 
0 


WT R526A R526E R526K R526L RS5261 R526V 


图 8.7 R526 位 点 突变 对 两 种 底 物 活力 的 影响 
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6000 
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mop -æ R526A 
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Ё 
5 R526K 
2 3000+ 2s 
x + R5261 
3 2000 - —e- R526L 
Mo + R526V 
0 ы 


0 4 16 20 


8 12 
底 物 酰基 链 长 度 
图 8.8 野生 型 apAPH 和 其 突变 体 对 不 同 链 长 对 确 基 芋 酚 酯 的 比 活 


8.4.3.4 计算 机 建 模 

蛋白 质 分 子 的 动态 构象 是 酶 发 挥 功能 的 决定 性 因素 ， 利 用 分 子 动力 学 模 
拟 对 蛋白 质 在 溶液 中 的 动态 行为 进行 分 析 ， 有 助 于 理解 突变 体 功 能 变化 的 机 
理 。 通 过 分 析 已 知 的 及 氨 酸 寒 肽 酶 与 二 肽 酶 人 的 晶体 结构 ， 我 们 可 以 获得 
apAPH 底 物 结合 位 点 的 足够 信息 ， 并 以 此 为 基础 应 用 Insight [软件 进行 分 
子 对 接 ， 得 到 apAPH 与 肽 酶 底 物 AcLeu-pNA 复合 物 的 构象 。ApAPH Ж 
酶 底 物 结合 口袋 的 SI 亚 部 位 临近 活性 中 心 ， 主 要 由 Met477、Phe485、 
Phe488, Ile489, Leu492, Trp474, Tyr446 和 Val471 等 疏水 残 基 构 成 ， 以 
Bik EASE РІ 位 氨基 酸 ，S2-P2 相互 作用 主要 是 Arg526 1E rto fir LAE 
侧 链 与 底 物 P2 酰基 氧 通 过 氢 键 实现 [图 8. 9(a)]。 而 apAPH 结合 酯 酶 底 物 
PNPC8 的 位 点 主要 是 由 Phe371、Phe485 和 Phe488 的 侧 链 与 Gly368- 
Pro370 的 主 链 构成 ， 形 成 了 明显 的 朴 水 隧道 [图 8. 9(b)]。 


图 8.9 apAPH 的 肽 结合 位 点 (а) 和 酯 结合 位 点 (b) 
使 用 PROCHEK 软件 绘制 对 接 模型 的 拉 氏 构象 图 ， 证 明了 酶 - 底 物 复合 
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图 8.10 арАРН 的 PROCHECK 拉 氏 构象 图 ( 见 彩 图 ) 
红色 区 域 代表 核心 允许 区 ， 黄 色 指 一 般 允 许 区 ， 亮 黄色 指 最 大 允许 区 ， 白 色 指 不 合理 区 


PROCHECK 


Ramachandran Plot 
pNPC8/apAPH 


图 8.11 84% pNPC8/apAPH 的 PROCHECK 拉 氏 构象 图 〈 见 彩 图 ) 
红色 区 域 代表 核心 允许 区 ， 黄 色 指 一 般 允 许 区 ， 亮 黄色 指 最 大 允许 区 ， 白 色 指 不 合理 区 
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PROCHECE: Ramachandran Plot 
Ac-Leu-pNA/apAPH 
180 ЖЫ 


n 
s A BEN = 


v ciens К ыг 
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Ld = — 
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Phi 


Р 8.12 AccLeu-pNA/apAPH 复合 物 的 PROCHECK 拉 氏 构象 图 〈 见 彩 图 ) 
红色 区 域 代 表 核心 允许 区 ， 黄色 指 一 般 允许 区 ， 亮 黄色 指 最 大 允许 区 ， 白 色 指 不 合理 区 


表 8.3 计算 机 模 建 模型 的 拉 氏 数据 统计 


io № 残 基数 最 合理 区 | 一 般 允 许 区 | 最 大 允许 区 | 不 合理 区 
apAPH 573 78.6% 1.1% 
pNPC8/apAPH 573 77.8% 0.4% 


Ac-Leu-pNA /apAPH 573 83.3% 0.2% 


物 模拟 结构 的 合理 性 CHE 8. 10 一 图 8. 12) 。 由 表 8.3 可见， 野生 型 apAPH 
酶 与 pNPC8/apAPH、Ac-Leu-pNA/apAPH 复合 物 三 者 的 肽 链 残 基 二 面 角 
合理 性 分 布 大 体 近 似 ， 其 中 处 于 不 可 接受 区 域 的 残 基 上 比率 分 别 为 1. 1%、 
0.4% 和 0.2%。 与 野生 型 相 比 ， 虽 然 在 两 种 酶 - 底 物 复合 物 的 模型 内 添加 了 
小 分 子 ， 但 是 经 过 能 量 优化 后 的 pNPC8/apAPH、Ac-Leu-pNA /apAPH 模 
型 的 肽 链 构象 还 要 优 于 不 带 底 物 的 空 酶 分 子 晶体 结构 。 在 酶 - 底 物 复合 物 的 
拉 氏 构象 图 中 ， 参 与 底 物 结合 的 残 基 基本 分 布 在 最 优 构 象 区 ， 表 明 构 建 的 模 
型 中 小 分 子 对 接 与 蛋白 质 结合 位 点 的 界面 构象 合理 。 可 以 在 此 结构 基础 上 进 
行 突变 体 的 建 模 ， 并 进行 更 深入 的 结构 分 析 与 分 子 动力 学 模拟 计算 。 
8.4.8.5 分 子 动力 学 模拟 

我 们 选择 了 活力 变化 明显 的 突变 体 ， 应 用 分 子 动力 学 模拟 对 它们 与 酯 
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酶 底 物 pNPCS 和 肽 酶 底 物 AcLeu-pNA 的 作用 模式 进行 了 详细 研究 ， 
以 期 揭示 活力 变化 的 原因 。pNPC8 复合 物 分 子 动力 学 模拟 的 结果 如 图 
8.13 所 示 ， 野 生 型 Arg526 在 一 级 序列 上 与 活性 中 心 的 Asp524 只 间隔 
一 个 残 基 ， 其 正 电 侧 链 指向 活性 中 心 His556 上 方 ， 虽 然 在 pNPC8/ 
apAPH 模型 中 其 侧 链 并 未 与 底 物 分 子 发 生 直接 的 接触 ， 但 是 其 正 电 股 
基 侧 链 靠近 底 物 结合 部 位 ， 有 可 能 对 底 物 的 正确 定向 产生 影响 。 在 分 
子 动力 学 模拟 过 程 中 ，Arg526 的 精 氨 酸 侧 链 移动 很 小 (RMSD 约 等 于 
0. 5A) ， 与 底 物 分 子 的 距离 也 保持 相对 稳定 [图 8.1300]. 


fi 
Los WS. t 
D. 


图 8.13 复合 物 模型 pNPC8/apAPH (a), pNPC8/R526E (b) 和 
pNPC8/R526V (c) 100 皮 秒 分 子 动力 学 模拟 构象 重合 


突变 体 R526V 对 pNPCS 的 催化 效率 比 野生 型 提高 了 约 6 倍 。 在 
100ps 的 分 子 动力 学 模拟 过 程 中 ， 突 变 的 Val 侧 链 表现 出 非常 大 的 柔 
性 (RMSD 约 为 2. 6 入， 而 其 他 的 氨基 酸 此 值 均 小 于 1A) ， 由 于 底 物 的 
酰基 侧 链 受 到 朴 水 的 Val 侧 链 牵引 ， 导 致 底 物 分 子 与 野生 型 模型 相 比 ， 
分 子 扭曲 程度 明显 加 大 [图 8.13(b)]。 这 种 作用 有 可 能 对 小 分 子 底 物 
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的 定向 产生 影响 ， 使 得 酶 与 底 物 的 相对 位 置 和 尺寸 更 有 利于 反应 进行 ， 
从 而 使 R526V 的 催化 效率 明显 提高 。 

突变 体 R526E 是 在 我 们 的 研究 中 唯一 表现 出 酯 酶 活力 催化 效率 下 
降 的 突变 体 ， 酶 动力 学 数据 显示 ， 酶 和 底 物 结合 能 力 的 下 降 (Ka + 
й) 是 导致 其 活力 下 降 的 主要 原因 。 在 R526E 与 酯 酶 底 物 的 复合 物 模 
型 中 可 见 ， 与 野生 型 相 比 ， 其 侧 链 沿 C。-Cs 和 Cp-Cr 发 生 较 大 扭转 ， 
新 的 侧 链 位 置 指向 酯 底 物 结合 隧道 ， 位 于 底 物 下 方 [图 8. 13(c)]， 并 
且 在 分 子 动力 学 过 程 中 观察 到 其 负电 末端 与 疏水 的 底 物 酰基 侧 链 ， 底 
物 结合 位 点 中 的 Phe485 也 有 直接 相互 作用 ， 这 两 种 作用 可 能 就 是 酶 - 
底 物 结合 力 明 显 前 弱 ， 酶 活力 大 幅度 下 降 的 主要 原因 。 

在 野生 型 apAPH 与 肽 酶 底 物 Ac-Leu-pNA 的 分 子 动力 学 模拟 过 
程 中 [图 8. 14(a)]，Arg526 的 侧 链 肌 基 始终 保持 位 置 稳定 ， 肌 基 一 
侧 的 Nn 与 底 物 P2 位 的 酰基 氧 形成 氢 键 ， 另 一 侧 Nw 与 推进 器 结构 域 
上 的 Glu88 形成 离子 键 ， 这 个 氢 键 网 络 保证 了 底 物 分 子 与 酶 形成 较 稳 


(b) i: Ac-Leu-pNA S 
Ac-Leu-pNA 
© ES = 


8.14 复合 物 模型 Ac-Leu-pNA/apAPH (а), Ac-Leu-pNA/R526K (b) 和 
Ac-Leu-pNA/R526E (c) 100ps 分 子 动力 学 模拟 构象 重重 
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定 的 复合 物 。 在 整个 动力 学 模拟 过 程 中 底 物 分 子 的 位 置 偏 移 很 小 
(RMSD 约 为 1A) ， 而 在 其 他 突变 体 的 分 子 动力 学 模拟 中 此 值 均 大 于 
1.5A。 

突变 体 R526E 对 肽 酶 底 物 的 催化 效率 明显 下 降 ， 其 Km 值 较 野生 
型 提高 了 约 15 倍 ，kcat 降 低 了 约 20 倍 。R526E 突变 破坏 了 野生 型 S2- 
P2 相互 作用 中 Arg526 与 底 物 分 子 的 氢 键 。 除 此 之 外 ， 在 其 分 子 动力 
学 模拟 中 R526E 的 羧基 侧 链 表现 出 较 大 的 分 子 柔性 ， 与 底 物 Sl 结合 
位 点 中 的 Phe485 发 生 了 直接 相互 作用 ， 降 低 了 酶 与 底 物 结合 的 主要 作 
用 力 ， 导 致 Km 值 的 升 高 [图 8. 14(b)]; R526E ken 值 的 降低 可 能 是 
由 于 526 突变 为 Glu 后 影响 了 临近 的 催化 残 基 Asp524 侧 链 的 位 置 ， 
使 催化 三 联 体 的 正常 运转 受到 影响 而 导致 的 。 

作为 与 精 氨 酸 具有 类 似 长 度 和 电荷 性 质 的 赖 氨 酸 ，R526K Ж 
变 同样 导致 酶 对 肽 底 物 Km 值 的 明显 提高 。 在 分 子 动力 学 模拟 的 过 
程 中 ，Lys 侧 链 明显 受到 了 Glu88 的 吸引 [图 8. 14(c)]， 导 致 在 整 
个 分 子 动力 学 模拟 中 ， 始 终 不 能 与 底 物 的 酰基 氧 形成 氢 键 ， 致 使 
酶 和 底 物 的 S2-P2 相互 作用 被 破坏 ， 导 致 其 在 Km 值 上 基本 与 侧 链 
很 小 的 R526A 十 分 接近 。 这 表明 尽管 在 20 种 氨基 酸 里 Lys 与 Arg 
最 为 相似 ， 但 是 仍然 不 能 替代 其 在 此 发 挥 作 用 。 


8.4.4 讨论 


Arg526 位 于 apAPH 的 活性 中 心 ， 并且 在 整个 且 氨 酸 赛 肽 酶 (POP) 
家 族 中 高 度 保守 ， 说 明 它 具有 重要 的 作用 。 在 猪 POP 与 抑制 剂 的 共 结 晶 结 
构 中 发 现 ，Arg526 对 应 的 残 基 Arg643 参与 了 底 物 的 结合 。 通 过 本 章 描述 
的 实验 ， 我 们 确认 了 Arg526 位 点 在 apAPH 与 肽 酶 底 物 结合 中 具有 重要 的 
作用 。 实 验 结果 表明 ， 在 арАРН 催化 肽 酶 底 物 水 解 时 Arg526 位 点 主要 参 
与 了 酶 与 底 物 S2-P2 相互 作用 。 这 种 作用 主要 是 通过 Arg B0 БЕД ЖЕ ЖИ 
与 底 物 P2 位 酰基 氧 形成 氢 键 而 实现 的 。 将 Arg 突变 为 任意 一 个 氨基 酸 都 会 
引起 催化 效率 的 下 降 ， 最 佳 的 残 基 (Arg) 与 最 差 的 残 基 (Glu) НШ, Ж 
化 效率 相差 100 倍 以 上 ， 证 明 Arg 在 526 位 点 的 保守 性 是 由 于 维持 功能 的 
需要 。 突 变 体 R526K 与 野生 型 相 比 ， 仅 仅 将 侧 链 变 小 却 使 R526K 的 Km 变 
为 所 有 突变 体 中 最 大 的 ， 说 明 Arg 在 526 位 点 的 功能 经 过 自然 进化 的 微调 
已 经 达到 最 优化 ， 任 何 突变 都 会 使 酶 活力 产生 巨大 的 降低 。 类 似 地 ，R526A 
与 R526I、R526L、R526V 同属 不 带电 的 朴 水 突变 ， 但 是 R526A 的 Km 值 却 
高 于 其 他 侧 链 较 大 的 突变 2 倍 以 上 ， 表 明 在 此 位 置 新 引入 的 疏水 侧 链 ， 虽 然 
稳定 底 物 结合 作用 不 能 像 Arg 一 样 强 ， 但 是 与 完全 消除 侧 链 影响 的 R526A 
相 比 ， 仍 较 有 利于 底 物 的 结合 。 
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我 们 发 现 526 {у кх ТЕЙИШ К йн] АЈ TESA. HA KM 
的 突变 体 水 解 酯 酶 底 物 的 活力 均 明 显 提高 ， 而 带电 荷 的 R526K、R526E 
及 野生 型 apAPH (Arg526) 与 带 有 朴 水 侧 链 的 突变 体 相 比 则 活力 明显 降 
低 。 这 个 结果 在 分 子 对 接 中 也 得 到 了 确认 ， 在 pNPC8/apAPH 的 复合 物 模 
型 中 ，Arg526 位 于 酯 酶 底 物 的 疏水 通道 中 ， 其 正 电 侧 链 必 定 会 影响 朴 水 
的 酯 酶 底 物 进 入 活性 中 心 ， 而 将 其 突变 为 朴 水 的 残 基 有 利于 酶 与 底 物 的 
结合 。 

在 本 实验 的 分 子 动力 学 模拟 中 发 现 ，Arg526 参与 到 一 个 由 Argl05, 
Glu88 与 其 共同 构成 的 离子 网 络 中 ， 锚 定 了 Arg526 的 侧 链 位 置 。 使 得 在 整 
个 分 子 动力 学 模拟 过 程 中 ，Arg526 在 两 种 酶 底 物 复合 物 模型 的 侧 链 位 置 一 
直 稳 定 。 这 个 离子 网 络 位 于 催化 结构 域 与 8- 推 进 器 结构 域 的 界面 上 ， 起 到 了 
连接 两 个 结构 域 的 作用 ， 在 整个 POP 家 族 中 保守 程度 很 高 。 已 有 实验 证 明 ， 
在 猪 POP 中 这 种 相互 作用 对 于 肽 底 物 进入 活性 中 心 具 有 重要 作用 ， 起 到 了 
控制 底 物 进入 通道 的 开关 作用 。 

有 晴 氨 酸 赛 肽 酶 家 族 作 为 丝氨酸 蛋白 酶 中 新 近 确立 的 一 员 ， 自 发 现 以 来 
一 直 受 到 人 们 的 关注 。 尽 管 早 在 1992 年 ，Polgar 就 提出 POP 家 族 与 酯 酶 
家 族 在 进化 上 更 为 相近 ， 但 是 关于 它们 之 间 进 化 关系 的 线索 一 直 缺 少 直接 
的 证 据 。 我 们 通过 CE 数据 库 的 三 级 结构 比较 发 现 : apAPH 催化 结构 域 与 
HSL 类 酯 酶 AFEST 结构 相似 性 非常 高 。 一 般 来 源 于 一 个 共同 祖先 的 后 
代 ， 在 序列 相似 性 低 于 25% 时 ， 仍 能 在 结构 上 保持 主 链 结构 偏差 小 于 
2A。apAPH 催化 结构 域 与 AFEST 之 间 序 列 相似 性 仅 为 18%， 可 主 链 偏 
差 仅 为 2. 3A。 表 明 两 者 很 有 可 能 来 源 于 同一 祖先 ， 并 且 两 者 都 对 长 链 酷 
底 物 表 现 出 高 水 解 活力 。 在 HSL 类 酯 酶 中 ，Arg526 的 对 应 位 点 强烈 偏 嗜 
朴 水 氨基 酸 CE 8. 1) 。 结 合 在 本 试验 的 结果 ，526 位 点 的 疏水 残 基 会 显著 
提高 apAPH 对 酯 酶 底 物 的 催化 活力 ， 我 们 推测 POP 家 族 与 HSL 具有 共 
同 的 祖先 。 而 Arg526 可 能 是 蛋白 酶 和 脂肪 酶 趋 异 进化 中 的 一 个 进化 标记 
位 点 。 


8.4.5 小 结 


在 本 章 工作 中 ,我们 发 现 来 源 于 Archeoglobus fulgidus 的 激素 敏感 脂 
肪 酶 AFEST 与 apAPH 的 结构 相似 性 非常 高 ， 有 可 能 来 源 于 同一 祖先 。 通 
过 对 在 POP 家 族 中 高 度 保守 的 Arg526 位 点 进行 饱和 突变 ， 我 们 证 明了 该 
位 点 对 apAPH 肽 酶 / 酯 酶 活力 的 选择 性 起 到 了 重要 作用 。 在 对 其 饱和 突变 
库 进 行 筛选 的 过 程 中 ， 我 们 观察 到 几乎 所 有 R526X 突变 体 肽 酶 活力 都 出 现 了 
下 降 ， 而 大 部 分 的 突变 体 酯 酶 活力 升 高 。 通 过 酶 动力 学 分 析 与 分 子 动力 学 模 
W, 证 明了 Arg526 位 点 对 肽 类 及 酯 类 底 物 具有 不 同 的 作用 方式 : 它 参与 了 
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酶 与 肽 类 底 物 的 S2-P2 相互 作用 ， 有 利于 肽 酶 底 物 的 结合 ; 但 其 带电 侧 链 影 
响 了 玖 水 的 酯 酶 底 物 进入 活性 中 心 ， 将 其 突变 为 玖 水 残 基 有 利于 酯 酶 底 物 的 
水 解 。 本 章 工 作 提供 了 单 点 突变 导致 酶 功能 转换 的 稀有 例证 ， 揭 示 了 膊 氨 酸 
寡 肽 酶 家 族 与 脂肪 酶 家 族 在 分 子 进化 上 的 相关 性 : 在 АРН 的 进化 历程 中 单 
一 位 点 的 突变 即 可 使 其 从 酯 酶 转换 为 肽 酶 ， 而 Arg526 很 可 能 是 其 趋 异 进化 
的 一 个 标记 位 点 。 
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